全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

12:50

12:50

arXiv cs.AI@Pu Ning, Quan Chen, Kun Tao, Xinyu Tang, Tianshu Wang, Qianggang Cao, Xinyu Kong, Zujie Wen, Zhiqiang Zhang, Jun Zhou

72°

SearchSwarm 提出了一种新范式，让主智能体通过分解任务并委托给子智能体来应对无限增长的上下文需求，从而解决长时深度研究任务。该团队设计了一个引导框架，生成高质量的任务分解和委托轨迹，并用这些数据微调模型，将委托智能内化到模型权重中。SearchSwarm-30B-A3B 在 BrowseComp 和 BrowseComp-ZH 上分别取得 68.1 和 73.3 的成绩，是同等规模模型中的最佳结果。这项工作填补了开源社区在委托智能训练数据合成方面的空白，并计划开源相关资源。

论文委托智能长时任务深度研究 SearchSwarm 开源/仓库

推荐理由：做长时深度研究或复杂任务自动化的开发者，终于有了一个能高效委托子任务的模型——SearchSwarm 用30B参数就超越了更大模型，值得直接试试它的开源实现。

6月5日

12:00

12:00

arXiv cs.AI@Yasmine Omri, Ziyu Gan, Zachary Broveak, Robin Geens, Zexue He, Alex Pentland, Marian Verhelst, Tsachy Weissman, Thierry Tambe

精选72°

该论文首次对 LLM 智能体的记忆系统进行系统性表征，提出了面向系统的四轴分类法，并构建了阶段感知的性能分析工具。研究覆盖了 10 个代表性记忆系统在两个基准套件上的行为，揭示了设计选择如何影响写入和读取路径的代价。最终给出了 10 条系统设计建议，涵盖构建调度、能力下限、查询量摊销、新鲜度-延迟权衡及集群管理。这项工作为构建高效、可扩展的长期记忆智能体提供了关键指导。

论文智能体记忆系统系统表征长时任务性能分析

推荐理由：做智能体系统架构的团队终于有了第一份记忆系统性能基准——10 条设计建议直接指导工程决策，建议做 Agent 框架或记忆中间件的开发者点开细读。