全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

13:05

Aran Komatsuzaki (论文推介)@arankomatsuzaki

精选

Aran Komatsuzaki 使用 Codex 的 /goal 命令，自动探索一些 20-50 年历史的未解猜想，运行 8 小时后已看到可发表的进展。他认为人们高估了“开放数十年”作为重要性的指标，很多旧问题只是无聊但难，而非真正重要。他主张加速近期研究方向，因为社区有共识和品味，而旧问题参与者少、门槛高。他的更强观点是：当前模型已能 95% 自动化地推动前沿，但领域人士保守、AI 人士不了解深层问题，导致这一能力被低估。

AI产品 Codex 自动推理数学猜想 AI 研究未解问题

推荐理由：Aran 用 Codex 自动探索未解猜想 8 小时就看到了可发表进展，做自动推理或数学研究的开发者值得关注——这暗示了 AI 在数学前沿的潜力被严重低估，建议试试 Codex /goal 在自己的领域跑一跑。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:26

Sakana AI@SakanaAILabs

精选

Sakana AI 在东京成立专门研究递归自我改进（RSI）的实验室「RSI Lab」，旨在让 AI 自动生成并改进 AI 模型。该实验室基于此前在 LLM-Squared、The AI Scientist 等项目上的积累，目标是在不依赖无限计算资源的前提下实现 RSI。2026 年以来，RSI 已成为全球 AI 研究的重要趋势，Sakana AI 希望凭借其独特方法，在计算资源有限的日本推动这一领域的发展。实验室将招募全球研究人员和工程师，并与社区共享成果。

行业递归自我改进 Sakana AI RSI Lab AI 研究东京

推荐理由：RSI 是让 AI 自我进化的前沿方向，做 AI 研究和模型开发的团队值得关注——Sakana AI 试图用更少的算力实现它，这对资源有限的团队尤其有启发。

原文

05:40

rohanpaul_ai@rohanpaul_ai

精选

一篇论文提出 SIA（自我改进 AI）框架，让 AI 通过观察任务代理的表现，自动调整外部设置（如提示、工具、重试规则）或更新模型权重（通过 LoRA 适配器）。在三个差异极大的任务（中文法律罪名分类、GPU 内核速度调优、单细胞 RNA 去噪）上，结合设置与权重更新的版本均优于仅改进设置的方法。这表明，除了优化提示和工具，让模型通过任务反馈学习模式能带来额外提升。

论文自我改进 LoRA 任务代理自动化 AI 研究

推荐理由：这项研究解决了 AI 自我改进依赖人工调参的瓶颈，做自动化 Agent 或模型微调的团队值得关注——SIA 的 LoRA 更新思路能低成本让模型学会任务模式，比只改提示更有效。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月2日

22:37

Nathan Lambert: Interconnects@Nathan Lambert

作者在艾伦人工智能研究所（Ai2）的最后一周，回顾了参与 Olmo 模型开发的工作经历。文章分享了在 Ai2 的成长与学习，以及如何通过 Olmo 模型产生广泛而持久的影响。这不仅是个人告别，也反映了开源 AI 研究机构的发展与挑战。

行业 Ai2 Olmo 开源模型 AI 研究行业动态

推荐理由：对于关注开源大模型和 AI 研究机构动态的从业者，这篇文章提供了 Olmo 模型背后的真实视角和行业思考，值得一读。

原文

5月30日

12:16

OpenAI@OpenAI (@OpenAI)

OpenAI 与研究员 Terence 对话，探讨 AI 如何减少研究中的认知摩擦，帮助保留发现背后的路径，并拓展数学家和科学家可尝试的范围。Terence 认为 AI 能加速科研流程，让研究者更专注于创造性思考。该讨论反映了 AI 在科学发现中的潜在变革作用。

行业 AI 研究认知摩擦科研工具 OpenAI 科学发现

推荐理由：科研人员关注：AI 正在改变研究方式，减少繁琐工作，让你更专注于创新。建议点开了解未来科研工具的新方向。

原文

5月29日

05:12

Y Combinator@ycombinator

YC 在 Mountain View 举办了首届 Paper Club 活动，汇聚 AI 研究者和创始人，讨论前沿研究及其生产化挑战。活动包括多个论文演讲，如推测解码、扩散模型-MPC、世界建模、深度学习非神秘化及无限计算预训练。这标志着 YC 在连接学术研究与实际应用方面的努力，为 AI 社区提供了交流平台。

行业 YC Paper Club AI 研究生产落地社区活动

推荐理由：YC 首次 Paper Club 活动将前沿研究与生产落地结合，AI 研究者和创业者可以从中了解最新论文趋势及实际部署经验，值得关注。

原文

5月23日

21:09

Decoder@Matthias Bastian

中国 AI 初创公司 Deepseek 即将完成约 100 亿美元融资，估值约 450 亿美元。创始人梁文峰向投资者明确表示，公司将优先投入通用人工智能（AGI）研究，而非追求短期盈利。这一表态凸显了 Deepseek 在巨额资本支持下坚持长期技术路线的决心，也反映了当前 AI 领域对 AGI 研发的持续投入趋势。

行业 Deepseek AGI 融资长期战略 AI 研究

推荐理由：Deepseek 在巨额融资下仍坚持 AGI 优先，这对关注 AI 长期发展的投资者和研究者是个重要信号——值得关注其技术路线与商业平衡的后续进展。

原文

5月22日

22:11

Gary Marcus@GaryMarcus

AI 研究者 Gary Marcus 在 X 上公开承认此前对 OpenAI 新模型 Erdos 的批评有误。他根据新信息表示，即使 OpenAI 在 Erdos 上使用了新模型，但 GPT-5.5 也能实现类似效果，Ethan Mollick 的估算基本适用。这一反转表明，当前 GPT 系列的能力可能被低估，且新模型与现有模型的差距可能没有想象中大。对于关注 AI 模型进展和评估的研究者与开发者，这是一个值得注意的修正。

AI模型 GPT-5.5 Erdos Gary Marcus 模型评估 AI 研究

推荐理由：Gary Marcus 公开认错，说明 AI 模型评估比想象中复杂——做模型对比的团队值得关注这个反转，避免自己踩坑。

原文

5月14日

13:36

EleutherAI@AiEleuther

EleutherAI 团队在 ICLR 2026 会议上组织线下聚会，成员包括 @BlancheMinerva、@GoncaloSPaulo、@norabelrose 等。参会者可通过 Discord 的 #general > ICLR 2026 Meetup 线程协调会面。这为关注开源 AI 研究的社区成员提供了面对面交流的机会。

行业 EleutherAI ICLR 2026 线下聚会开源社区 AI 研究

推荐理由：如果你关注开源 AI 研究或 EleutherAI 的工作，ICLR 2026 的聚会是直接与核心成员交流的好机会，建议参会者加入 Discord 线程协调。

原文