12:50arXiv cs.AI@Pu Ning, Quan Chen, Kun Tao, Xinyu Tang, Tianshu Wang, Qianggang Cao, Xinyu Kong, Zujie Wen, Zhiqiang Zhang, Jun Zhou72°SearchSwarm 提出了一种新范式,让主智能体通过分解任务并委托给子智能体来应对无限增长的上下文需求,从而解决长时深度研究任务。该团队设计了一个引导框架,生成高质量的任务分解和委托轨迹,并用这些数据微调模型,将委托智能内化到模型权重中。SearchSwarm-30B-A3B 在 BrowseComp 和 BrowseComp-ZH 上分别取得 68.1 和 73.3 的成绩,是同等规模模型中的最佳结果。这项工作填补了开源社区在委托智能训练数据合成方面的空白,并计划开源相关资源。论文委托智能长时任务深度研究SearchSwarm开源/仓库推荐理由:做长时深度研究或复杂任务自动化的开发者,终于有了一个能高效委托子任务的模型——SearchSwarm 用30B参数就超越了更大模型,值得直接试试它的开源实现。原文
12:00arXiv cs.AI@Yasmine Omri, Ziyu Gan, Zachary Broveak, Robin Geens, Zexue He, Alex Pentland, Marian Verhelst, Tsachy Weissman, Thierry Tambe精选72°该论文首次对 LLM 智能体的记忆系统进行系统性表征,提出了面向系统的四轴分类法,并构建了阶段感知的性能分析工具。研究覆盖了 10 个代表性记忆系统在两个基准套件上的行为,揭示了设计选择如何影响写入和读取路径的代价。最终给出了 10 条系统设计建议,涵盖构建调度、能力下限、查询量摊销、新鲜度-延迟权衡及集群管理。这项工作为构建高效、可扩展的长期记忆智能体提供了关键指导。论文智能体记忆系统系统表征长时任务性能分析推荐理由:做智能体系统架构的团队终于有了第一份记忆系统性能基准——10 条设计建议直接指导工程决策,建议做 Agent 框架或记忆中间件的开发者点开细读。原文