全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

05:36

05:36

Gary Marcus@GaryMarcus

Gary Marcus 转发了一项新研究，该研究提出了一个名为 SciConBench 的基准测试，包含 9.11k 个来自 Cochrane 系统评价的科学问题。测试发现，前沿 AI 智能体无法有效综合科学结论，这挑战了 AI 作为科学家的过度宣称。该研究由 Manoel Ribeiro 等人完成，结果对 AI 在科学领域的可靠性提出了质疑。

论文 AI 科学家 SciConBench 基准测试科学综合 Gary Marcus

推荐理由：这项研究直接戳破了 AI 作为科学家的泡沫，做科研或依赖 AI 进行文献综述的团队值得一看，避免被过度宣传误导。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月7日

00:55

00:55

rohanpaul_ai@rohanpaul_ai

精选

MIT 新论文提出一种自修正发现系统，旨在让 AI 科学家在科学探索中不仅搜索现有方案，还能识别当前思维框架的局限性并主动引入新概念。现有 AI 科学系统大多在固定设置内搜索，而真实科学需要新变量、工具或假设。该框架通过将数据、模型、失败等所有产出标记为带类型的工件，区分检索、搜索和发现三种操作，其中发现意味着改变系统本身的表达方式。论文试图形式化 AI 系统长期回避的问题：在语言内找到答案与获得改变语言的权利之间的区别。

论文 AI 科学家科学发现自修正系统 MIT 论文

推荐理由：这篇论文戳中了当前 AI 科学系统的核心瓶颈——只会搜索不会创新，做 AI 科研或科学自动化的团队值得关注，它给出了一个严谨的形式化框架来定义真正的发现。