全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月26日

23:02

23:02

rohanpaul_ai@rohanpaul_ai

72°

Meta、斯坦福、谷歌等顶级实验室联合提出AutoResearchClaw，一种将自动化科研从“生产流水线”转变为“受控循环”的新框架。该框架允许AI在研究中失败、恢复并在适当时机向人类求助，将失败视为证据而非错误。在ARC-Bench基准上，AutoResearchClaw比AI Scientist v2提升54.7%，尤其在结果分析环节表现突出。实验显示，完全自主的科研接受率仅25%，而人类协作模式（CoPilot）达到87.5%，说明过度监督和缺乏判断都会损害科研质量。论文揭示了当前AI科研系统的关键边界：机器能验证数字的真实性，但人类仍能识别实验是否在问正确的问题。

论文 AI科研 AutoResearchClaw 人机协作自动化研究失败恢复

推荐理由：做AI科研自动化的团队会发现，这个框架把失败变成了系统的一部分，而不是bug——CoPilot模式87.5%的接受率值得所有做AI Scientist的人点开看看。

5月13日

00:33

00:33Google Research: Blog（资讯）

Google Research 博客更新多项AI研究成果，涵盖全球科研合作与开放资源、AI辅助科研工具、图像重构技术、基于经验学习的推理Agent、合成数据设计方法、AI加速脑神经图谱、生成式AI教育应用、用户模拟器、学术工作流AI代理及LLM行为对齐评估等10个方向。其中，ReasoningBank 让智能体从经验中学习，显著提升推理能力；AI生成合成神经元将脑图谱绘制速度提高50倍。这些进展显示了AI在基础科学、算法理论及实际应用中的广泛渗透与加速趋势。

行业 AI科研推理智能体合成数据安全评估开源/仓库

推荐理由：多项成果集中在AI辅助科研与智能体推理，尤其是ReasoningBank和AI加速脑神经研究，表明AI正从工具向自主式科研伙伴演进。对研究人员和AI工程师而言，这些开源资源和评估方法具有实践参考价值。