6月25日
10:37
10:37arXiv cs.LG@Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, Yixin Nie, Swarnadeep Saha, Eryk Helenowski, Weizhe Yuan, Olga Golovneva, Jack Lanchantin, Yoram Bachrach, Jakob Foerster, Xian Li, Han Fang, Sainbayar Sukhbaatar, Jason Weston
论文提出Autodata方法,让AI代理扮演数据科学家角色,自动构建高质量的训练和评估数据。通过元优化训练数据科学家代理,使其学会生成更优数据。在计算机科学、法律推理和数学对象推理任务上,该方法相比经典合成数据集创建方法取得更优结果。元优化数据科学家代理本身也带来更大性能提升,表明代理式数据创建可将推理计算量转化为高质量模型训练。

推荐理由:这篇论文教你让AI自己当数据科学家,自动造出比手动更好的训练数据,还能越造越强,做研究写代码都能用上。
09:38
09:38arXiv cs.AI@Ke Zhao, Zixiang Di, Hong Qian, Xiang Shu, Yaolin Wen, Qitao Shi, Bingdong Li, Xingyu Lu, Xiangfeng Wang, Jun Zhou, Ke Tang, Yang Yu
MiniOpt是一种强化学习框架,采用“推理-建模-求解”范式来优化问题。其OptReward奖赏函数通过分层分数结构联合评估建模与求解,避免专家演示依赖。在少于10B参数的模型中,MiniOpt系列取得最高平均求解精度(SA)。MiniOpt-3B在多种优化类型和任务领域展示强泛化能力,代码已开源。
推荐理由:想用小型模型搞定各种优化问题?MiniOpt用3B参数就做到了不错的效果,而且代码开源随便玩。
09:34
09:34arXiv cs.AI@Enrique Palacín, Fernando Bobillo, Ignacio Huitzil, Francesca A. Lisi, Umberto Straccia
该论文提出一个通用框架,用于在OWL本体和RDFS知识图谱上评估模糊量化查询。框架支持Type I和Type II模糊量化表达式的个体检索。核心优势在于不依赖特定量化器类型、评估方法或数据源。作者还发布了开源实现Q2S2以支持后续研究。
推荐理由:一篇论文提出了一个能处理模糊量化查询的通用框架,不挑量化器类型和数据源,还开源了Q2S2实现。