17:21Decoder@Matthias BastianSam Altman在斯坦福大学演讲中为LLM缩放策略进行辩护,批评整整一代研究者因低估缩放能力而阻碍了AI发展。他引用OpenAI最近推翻一个数学猜想的案例作为证据,认为缩放已被证实有效。Altman的言论引发了对AI研究方向的重新讨论。行业Sam AltmanOpenAI缩放策略AI研究10 个信源在谈推荐理由:Sam Altman在斯坦福直接开怼,说一群研究者低估了缩放的力量,还用OpenAI推翻数学猜想当证据,观点很尖锐。原文
14:33AI Will@FinanceYF5一条观点指出,未来18个月内每个AI工具都会内置特定的提问工作流。在此之前,掌握提问技巧的用户将获得优势。AI搜索负责提供答案,而AI研究负责提供判断。当前优势属于会提问的人。技巧提问技巧工作流AI搜索AI研究推荐理由:@FinanceYF5 说未来AI工具会内置提问工作流,现在会提问的人更占优。想提前掌握优势?原文
01:44Firecrawl@firecrawl_dev精选Firecrawl 推出 Research Index,一个针对 AI/ML 研究代理的专用索引。该索引在 arXivQA 基准上实现最先进召回率,比次优提供商高出 18%,成本相近。目前正在为 YC 研究实验室 Aemon_ai 提供自动研发支持。该索引旨在提升研究代理的信息检索效率。AI产品FirecrawlResearch IndexarXivQAAI研究检索推荐理由:Firecrawl 搞了个研究专用索引,召回率比同行高 18%,还已经用在 YC 实验室 Aemon_ai 了,做研究检索的朋友可以看看。原文
12:55arXiv cs.AI@Sara Fish该研究以EC 2025论文中一个关于公共物品稳定菜单的开放问题为测试平台,评估不同AI研究工作流的效果。实验发现:(1)在提示中加入人类直觉能提升LLM的“品味”;(2)多轮交互工作流在鼓励“大胆步骤”时更有效。与一名一年级博士生比较,LLM在解决该问题上的效果略逊一筹。研究尚未公开博士生参与前的原始手稿对比细节。论文EconCSLLM公共物品工作流AI研究推荐理由:这篇论文告诉你,用AI做经济学研究时,喂它人类直觉比纯指令好使,但别指望它比刚入行的博士生强多少。原文
12:53arXiv cs.AI@Kevin L Coakley, Thijs Snelleman, Holger Hoos, Odd Erik Gundersen该研究分析了2014至2024年间五大顶级AI会议发表的56800篇论文,评估其文档实践。结果显示,代码和数据共享比例从11%增至64%,增长了近六倍。基于文档实践推断的可重复性从28%提升至64%。这些改进在可重复性检查清单引入之前就已开始,反映的是开放科学趋势而非形式要求。论文可重复性AI研究开源科学文档实践推荐理由:这篇论文用56800篇数据告诉你,AI研究的可重复性在过去十年大幅提升,代码共享从11%涨到64%,而且不是靠强制清单推动的。原文
01:58EleutherAI@AiEleutherEleutherAI 启动 Summer of AI Research 2026 申请,活动周期为 7 月 13 日至 8 月 16 日。该项目为完全在线形式,面向研究经验较少的参与者。入选者将在资深研究员的指导下为开源 AI 研究项目做贡献。申请目前已开放。行业EleutherAISummer of AI Research 2026开源模型AI研究开源项目推荐理由:EleutherAI 搞了个暑期研究项目,没经验也能参加,导师带着你做开源AI,7月13号到8月16号,赶紧去申请看看。原文
04:32Logan Kilpatrick@OfficialLoganKLogan Kilpatrick与Google Research负责人Yossi Matias对话,探讨AI如何加速科学进步的“魔法循环”,改善全球真实生活,并指出我们正进入研究的黄金时代。Matias分享了AI在药物发现、气候预测等领域的实际应用案例,强调AI正从实验室走向现实世界。这场对话充满启发,展示了AI对科学研究的深远影响。行业AI研究科学进步Google ResearchAI应用行业对话2 个信源在谈推荐理由:想了解AI如何真正推动科学进步的研究者或从业者,这场对话值得一看——Google Research负责人的一线视角,比任何报告都更真实。原文
21:09Decoder@Jonathan Kemper精选一项涵盖20.8万名参与者和2600万次回答的大规模研究发现,将语言模型训练成有用聊天机器人的过程,反而削弱了它们模拟人类行为的能力。这种效应随着模型代际更新而加剧,即使是流行的“角色扮演”技巧(喂入人口统计特征)对个体预测也几乎没有帮助。研究指出,AI的“有用性”与“人性化”之间存在根本性矛盾,这对依赖AI进行社会模拟或用户行为预测的应用构成挑战。论文AI研究语言模型模拟人类行为角色扮演有用性推荐理由:做AI社会模拟、用户行为预测或角色扮演应用的团队,这项研究直接点出了当前模型的根本局限——越有用的AI越不像人,建议点开看看具体数据和影响。原文
11:36AK@_akhaliq精选72°Gamma-World 是一种生成式多智能体世界建模方法,超越了传统双玩家(如双人博弈)的限制,能够模拟多个智能体在复杂环境中的交互。该模型通过生成式框架学习智能体间的动态关系,适用于游戏、机器人协作等场景。研究展示了其在多智能体环境下的强大建模能力,为更复杂的群体智能研究提供了新工具。论文多智能体世界模型生成式模型AI研究Gamma-World推荐理由:多智能体系统开发者终于有了能处理超过两个智能体的世界模型——Gamma-World 解决了传统双玩家建模的瓶颈,做游戏 AI 或机器人协作的团队值得关注。原文
23:56François Chollet@fcholletFrançois Chollet 在推文中澄清,符号学习(Symbolic learning)并非要取代编程智能体,而是作为梯度下降和神经网络的替代方案。他将其描述为一种低层次、完全通用且极其可扩展的新型学习基底。这一观点重新定义了符号学习的定位,表明它可能在未来AI系统中扮演更基础的角色,为模型优化提供不同于反向传播的新途径。AI模型符号学习梯度下降神经网络AI研究学习范式推荐理由:重塑对符号学习的认知,明确其作为底层学习范式的潜力,对AI研究者和从业者理解未来方向有参考价值。原文