6月25日
10:37
10:37arXiv cs.LG@Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, Yixin Nie, Swarnadeep Saha, Eryk Helenowski, Weizhe Yuan, Olga Golovneva, Jack Lanchantin, Yoram Bachrach, Jakob Foerster, Xian Li, Han Fang, Sainbayar Sukhbaatar, Jason Weston
论文提出Autodata方法,让AI代理扮演数据科学家角色,自动构建高质量的训练和评估数据。通过元优化训练数据科学家代理,使其学会生成更优数据。在计算机科学、法律推理和数学对象推理任务上,该方法相比经典合成数据集创建方法取得更优结果。元优化数据科学家代理本身也带来更大性能提升,表明代理式数据创建可将推理计算量转化为高质量模型训练。

推荐理由:这篇论文教你让AI自己当数据科学家,自动造出比手动更好的训练数据,还能越造越强,做研究写代码都能用上。
09:34
09:34arXiv cs.AI@Enrique Palacín, Fernando Bobillo, Ignacio Huitzil, Francesca A. Lisi, Umberto Straccia
该论文提出一个通用框架,用于在OWL本体和RDFS知识图谱上评估模糊量化查询。框架支持Type I和Type II模糊量化表达式的个体检索。核心优势在于不依赖特定量化器类型、评估方法或数据源。作者还发布了开源实现Q2S2以支持后续研究。
推荐理由:一篇论文提出了一个能处理模糊量化查询的通用框架,不挑量化器类型和数据源,还开源了Q2S2实现。

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。