全部 AI 动态 · AI 热点

6月21日

17:21

17:21

Decoder@Matthias Bastian

Sam Altman在斯坦福大学演讲中为LLM缩放策略进行辩护，批评整整一代研究者因低估缩放能力而阻碍了AI发展。他引用OpenAI最近推翻一个数学猜想的案例作为证据，认为缩放已被证实有效。Altman的言论引发了对AI研究方向的重新讨论。

行业 Sam Altman OpenAI 缩放策略 AI研究

推荐理由：Sam Altman在斯坦福直接开怼，说一群研究者低估了缩放的力量，还用OpenAI推翻数学猜想当证据，观点很尖锐。

6月18日

14:33

14:33

AI Will@FinanceYF5

一条观点指出，未来18个月内每个AI工具都会内置特定的提问工作流。在此之前，掌握提问技巧的用户将获得优势。AI搜索负责提供答案，而AI研究负责提供判断。当前优势属于会提问的人。

技巧提问技巧工作流 AI搜索 AI研究

推荐理由：@FinanceYF5 说未来AI工具会内置提问工作流，现在会提问的人更占优。想提前掌握优势？

01:44

01:44

Firecrawl@firecrawl_dev

精选

Firecrawl 推出 Research Index，一个针对 AI/ML 研究代理的专用索引。该索引在 arXivQA 基准上实现最先进召回率，比次优提供商高出 18%，成本相近。目前正在为 YC 研究实验室 Aemon_ai 提供自动研发支持。该索引旨在提升研究代理的信息检索效率。

AI产品 Firecrawl Research Index arXivQA AI研究检索

推荐理由：Firecrawl 搞了个研究专用索引，召回率比同行高 18%，还已经用在 YC 实验室 Aemon_ai 了，做研究检索的朋友可以看看。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

12:55

12:55

arXiv cs.AI@Sara Fish

该研究以EC 2025论文中一个关于公共物品稳定菜单的开放问题为测试平台，评估不同AI研究工作流的效果。实验发现：(1)在提示中加入人类直觉能提升LLM的“品味”；(2)多轮交互工作流在鼓励“大胆步骤”时更有效。与一名一年级博士生比较，LLM在解决该问题上的效果略逊一筹。研究尚未公开博士生参与前的原始手稿对比细节。

论文 EconCS LLM 公共物品工作流 AI研究

推荐理由：这篇论文告诉你，用AI做经济学研究时，喂它人类直觉比纯指令好使，但别指望它比刚入行的博士生强多少。

12:53

12:53

arXiv cs.AI@Kevin L Coakley, Thijs Snelleman, Holger Hoos, Odd Erik Gundersen

该研究分析了2014至2024年间五大顶级AI会议发表的56800篇论文，评估其文档实践。结果显示，代码和数据共享比例从11%增至64%，增长了近六倍。基于文档实践推断的可重复性从28%提升至64%。这些改进在可重复性检查清单引入之前就已开始，反映的是开放科学趋势而非形式要求。

论文可重复性 AI研究开源科学文档实践

推荐理由：这篇论文用56800篇数据告诉你，AI研究的可重复性在过去十年大幅提升，代码共享从11%涨到64%，而且不是靠强制清单推动的。

01:58

01:58

EleutherAI@AiEleuther

EleutherAI 启动 Summer of AI Research 2026 申请，活动周期为 7 月 13 日至 8 月 16 日。该项目为完全在线形式，面向研究经验较少的参与者。入选者将在资深研究员的指导下为开源 AI 研究项目做贡献。申请目前已开放。

行业 EleutherAI Summer of AI Research 2026 开源模型 AI研究开源项目

推荐理由：EleutherAI 搞了个暑期研究项目，没经验也能参加，导师带着你做开源AI，7月13号到8月16号，赶紧去申请看看。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

04:32

04:32

Logan Kilpatrick@OfficialLoganK

Logan Kilpatrick与Google Research负责人Yossi Matias对话，探讨AI如何加速科学进步的“魔法循环”，改善全球真实生活，并指出我们正进入研究的黄金时代。Matias分享了AI在药物发现、气候预测等领域的实际应用案例，强调AI正从实验室走向现实世界。这场对话充满启发，展示了AI对科学研究的深远影响。

行业 AI研究科学进步 Google Research AI应用行业对话

推荐理由：想了解AI如何真正推动科学进步的研究者或从业者，这场对话值得一看——Google Research负责人的一线视角，比任何报告都更真实。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月30日

21:09

21:09

Decoder@Jonathan Kemper

精选

一项涵盖20.8万名参与者和2600万次回答的大规模研究发现，将语言模型训练成有用聊天机器人的过程，反而削弱了它们模拟人类行为的能力。这种效应随着模型代际更新而加剧，即使是流行的“角色扮演”技巧（喂入人口统计特征）对个体预测也几乎没有帮助。研究指出，AI的“有用性”与“人性化”之间存在根本性矛盾，这对依赖AI进行社会模拟或用户行为预测的应用构成挑战。

论文 AI研究语言模型模拟人类行为角色扮演有用性

推荐理由：做AI社会模拟、用户行为预测或角色扮演应用的团队，这项研究直接点出了当前模型的根本局限——越有用的AI越不像人，建议点开看看具体数据和影响。

5月28日

11:36

11:36

AK@_akhaliq

精选72°

Gamma-World 是一种生成式多智能体世界建模方法，超越了传统双玩家（如双人博弈）的限制，能够模拟多个智能体在复杂环境中的交互。该模型通过生成式框架学习智能体间的动态关系，适用于游戏、机器人协作等场景。研究展示了其在多智能体环境下的强大建模能力，为更复杂的群体智能研究提供了新工具。

论文多智能体世界模型生成式模型 AI研究 Gamma-World

推荐理由：多智能体系统开发者终于有了能处理超过两个智能体的世界模型——Gamma-World 解决了传统双玩家建模的瓶颈，做游戏 AI 或机器人协作的团队值得关注。

5月12日

23:56

23:56

François Chollet@fchollet

François Chollet 在推文中澄清，符号学习（Symbolic learning）并非要取代编程智能体，而是作为梯度下降和神经网络的替代方案。他将其描述为一种低层次、完全通用且极其可扩展的新型学习基底。这一观点重新定义了符号学习的定位，表明它可能在未来AI系统中扮演更基础的角色，为模型优化提供不同于反向传播的新途径。

AI模型符号学习梯度下降神经网络 AI研究学习范式

推荐理由：重塑对符号学习的认知，明确其作为底层学习范式的潜力，对AI研究者和从业者理解未来方向有参考价值。