全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月26日

23:02

23:02

rohanpaul_ai@rohanpaul_ai

72°

Meta、斯坦福、谷歌等顶级实验室联合提出AutoResearchClaw，一种将自动化科研从“生产流水线”转变为“受控循环”的新框架。该框架允许AI在研究中失败、恢复并在适当时机向人类求助，将失败视为证据而非错误。在ARC-Bench基准上，AutoResearchClaw比AI Scientist v2提升54.7%，尤其在结果分析环节表现突出。实验显示，完全自主的科研接受率仅25%，而人类协作模式（CoPilot）达到87.5%，说明过度监督和缺乏判断都会损害科研质量。论文揭示了当前AI科研系统的关键边界：机器能验证数字的真实性，但人类仍能识别实验是否在问正确的问题。

论文 AI科研 AutoResearchClaw 人机协作自动化研究失败恢复

推荐理由：做AI科研自动化的团队会发现，这个框架把失败变成了系统的一部分，而不是bug——CoPilot模式87.5%的接受率值得所有做AI Scientist的人点开看看。