09:38arXiv cs.AI@Ke Zhao, Zixiang Di, Hong Qian, Xiang Shu, Yaolin Wen, Qitao Shi, Bingdong Li, Xingyu Lu, Xiangfeng Wang, Jun Zhou, Ke Tang, Yang YuMiniOpt是一种强化学习框架,采用“推理-建模-求解”范式来优化问题。其OptReward奖赏函数通过分层分数结构联合评估建模与求解,避免专家演示依赖。在少于10B参数的模型中,MiniOpt系列取得最高平均求解精度(SA)。MiniOpt-3B在多种优化类型和任务领域展示强泛化能力,代码已开源。AI模型MiniOpt强化学习优化开源模型LLM推荐理由:想用小型模型搞定各种优化问题?MiniOpt用3B参数就做到了不错的效果,而且代码开源随便玩。原文
15:30arXiv cs.AI@Antonio Ielo, Francesco Doria, Sandra Castellanos-Paez, Marco Maratea, Francesco Percassi, Mauro Vallati精选该论文首次提出使用回答集编程(ASP)自动化长期电网规划过程。电网作为关键基础设施,需应对可持续目标、需求模式和城市化趋势,而规划周期可能长达十年,需保持拓扑和组合不变量。传统规划语言难以表达这些复杂约束,而ASP能简洁优雅地编码。实验在合成和真实电网数据上验证了该方法的表达力和有效性。论文电网规划回答集编程自动化基础设施优化推荐理由:电网规划人员终于有了自动化工具——ASP 优雅处理了传统语言难以表达的拓扑约束,做电力系统优化的团队可以直接参考论文方法。原文