13:05Aran Komatsuzaki (论文推介)@arankomatsuzaki精选Aran Komatsuzaki 使用 Codex 的 /goal 命令,自动探索一些 20-50 年历史的未解猜想,运行 8 小时后已看到可发表的进展。他认为人们高估了“开放数十年”作为重要性的指标,很多旧问题只是无聊但难,而非真正重要。他主张加速近期研究方向,因为社区有共识和品味,而旧问题参与者少、门槛高。他的更强观点是:当前模型已能 95% 自动化地推动前沿,但领域人士保守、AI 人士不了解深层问题,导致这一能力被低估。AI产品Codex自动推理数学猜想AI 研究未解问题推荐理由:Aran 用 Codex 自动探索未解猜想 8 小时就看到了可发表进展,做自动推理或数学研究的开发者值得关注——这暗示了 AI 在数学前沿的潜力被严重低估,建议试试 Codex /goal 在自己的领域跑一跑。原文
12:26Sakana AI@SakanaAILabs精选Sakana AI 在东京成立专门研究递归自我改进(RSI)的实验室「RSI Lab」,旨在让 AI 自动生成并改进 AI 模型。该实验室基于此前在 LLM-Squared、The AI Scientist 等项目上的积累,目标是在不依赖无限计算资源的前提下实现 RSI。2026 年以来,RSI 已成为全球 AI 研究的重要趋势,Sakana AI 希望凭借其独特方法,在计算资源有限的日本推动这一领域的发展。实验室将招募全球研究人员和工程师,并与社区共享成果。行业递归自我改进Sakana AIRSI LabAI 研究东京推荐理由:RSI 是让 AI 自我进化的前沿方向,做 AI 研究和模型开发的团队值得关注——Sakana AI 试图用更少的算力实现它,这对资源有限的团队尤其有启发。原文
05:40rohanpaul_ai@rohanpaul_ai精选一篇论文提出 SIA(自我改进 AI)框架,让 AI 通过观察任务代理的表现,自动调整外部设置(如提示、工具、重试规则)或更新模型权重(通过 LoRA 适配器)。在三个差异极大的任务(中文法律罪名分类、GPU 内核速度调优、单细胞 RNA 去噪)上,结合设置与权重更新的版本均优于仅改进设置的方法。这表明,除了优化提示和工具,让模型通过任务反馈学习模式能带来额外提升。论文自我改进LoRA任务代理自动化AI 研究推荐理由:这项研究解决了 AI 自我改进依赖人工调参的瓶颈,做自动化 Agent 或模型微调的团队值得关注——SIA 的 LoRA 更新思路能低成本让模型学会任务模式,比只改提示更有效。原文
22:37Nathan Lambert: Interconnects@Nathan Lambert作者在艾伦人工智能研究所(Ai2)的最后一周,回顾了参与 Olmo 模型开发的工作经历。文章分享了在 Ai2 的成长与学习,以及如何通过 Olmo 模型产生广泛而持久的影响。这不仅是个人告别,也反映了开源 AI 研究机构的发展与挑战。行业Ai2Olmo开源模型AI 研究行业动态推荐理由:对于关注开源大模型和 AI 研究机构动态的从业者,这篇文章提供了 Olmo 模型背后的真实视角和行业思考,值得一读。原文
12:16OpenAI@OpenAI (@OpenAI)OpenAI 与研究员 Terence 对话,探讨 AI 如何减少研究中的认知摩擦,帮助保留发现背后的路径,并拓展数学家和科学家可尝试的范围。Terence 认为 AI 能加速科研流程,让研究者更专注于创造性思考。该讨论反映了 AI 在科学发现中的潜在变革作用。行业AI 研究认知摩擦科研工具OpenAI科学发现10 个信源在谈推荐理由:科研人员关注:AI 正在改变研究方式,减少繁琐工作,让你更专注于创新。建议点开了解未来科研工具的新方向。原文
05:12Y Combinator@ycombinatorYC 在 Mountain View 举办了首届 Paper Club 活动,汇聚 AI 研究者和创始人,讨论前沿研究及其生产化挑战。活动包括多个论文演讲,如推测解码、扩散模型-MPC、世界建模、深度学习非神秘化及无限计算预训练。这标志着 YC 在连接学术研究与实际应用方面的努力,为 AI 社区提供了交流平台。行业YCPaper ClubAI 研究生产落地社区活动推荐理由:YC 首次 Paper Club 活动将前沿研究与生产落地结合,AI 研究者和创业者可以从中了解最新论文趋势及实际部署经验,值得关注。原文
21:09Decoder@Matthias Bastian中国 AI 初创公司 Deepseek 即将完成约 100 亿美元融资,估值约 450 亿美元。创始人梁文峰向投资者明确表示,公司将优先投入通用人工智能(AGI)研究,而非追求短期盈利。这一表态凸显了 Deepseek 在巨额资本支持下坚持长期技术路线的决心,也反映了当前 AI 领域对 AGI 研发的持续投入趋势。行业DeepseekAGI融资长期战略AI 研究推荐理由:Deepseek 在巨额融资下仍坚持 AGI 优先,这对关注 AI 长期发展的投资者和研究者是个重要信号——值得关注其技术路线与商业平衡的后续进展。原文
22:11Gary Marcus@GaryMarcusAI 研究者 Gary Marcus 在 X 上公开承认此前对 OpenAI 新模型 Erdos 的批评有误。他根据新信息表示,即使 OpenAI 在 Erdos 上使用了新模型,但 GPT-5.5 也能实现类似效果,Ethan Mollick 的估算基本适用。这一反转表明,当前 GPT 系列的能力可能被低估,且新模型与现有模型的差距可能没有想象中大。对于关注 AI 模型进展和评估的研究者与开发者,这是一个值得注意的修正。AI模型GPT-5.5ErdosGary Marcus模型评估AI 研究10 个信源在谈推荐理由:Gary Marcus 公开认错,说明 AI 模型评估比想象中复杂——做模型对比的团队值得关注这个反转,避免自己踩坑。原文
13:36EleutherAI@AiEleutherEleutherAI 团队在 ICLR 2026 会议上组织线下聚会,成员包括 @BlancheMinerva、@GoncaloSPaulo、@norabelrose 等。参会者可通过 Discord 的 #general > ICLR 2026 Meetup 线程协调会面。这为关注开源 AI 研究的社区成员提供了面对面交流的机会。行业EleutherAIICLR 2026线下聚会开源社区AI 研究推荐理由:如果你关注开源 AI 研究或 EleutherAI 的工作,ICLR 2026 的聚会是直接与核心成员交流的好机会,建议参会者加入 Discord 线程协调。原文