AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:递归自设计×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月9日
11:45
11:45arXiv cs.AI@Dun Li, Jiatao Li, Hongzhi Li
精选
这篇论文提出了 MetaAI 递归自设计的操作化证据框架,包含四个标准:可检查的目标系统、元级修改器、反馈导向选择和递归延续。作者将 DGM、STOP、Goedel Agent 和 ShinkaEvolve 等公开系统映射到该框架上,其中 DGM 提供了最直接的证据:经过 80 次迭代,SWE-bench Verified 从 20% 提升到 50%,Polyglot 从 14.2% 提升到 30.7%。消融实验表明开放探索和自我改进都有贡献。论文还提供了 MetaAI-Mini,一个基于 HumanEval 的可复现协议和代码库,但目前尚未包含完整模型运行结果。这项工作为 AI 自我改进提供了系统化的评估方法。
论文递归自设计MetaAIDGMSWE-bench可复现性

推荐理由:做 AI 自我改进研究的团队终于有了可对照的评估框架——DGM 的 80 轮迭代提升数据值得参考,建议用 MetaAI-Mini 协议复现验证。
原文
精选全部日报登录