多智能体系统

§ 01综述

多智能体系统（MAS）近期在学术与产业界均取得突破性进展，核心趋势是从单一任务协作向复杂科研自主化演进，同时面临幻觉传播等可靠性挑战。

近期主要进展

科研自动化加速：多智能体系统已能自动完成天体粒子物理研究（DarkAgents），并以“Lemma FARS”等系统实现单人一周完成实验室一年研究的工作量（Ate-a-Pi）。Google DeepMind 基于 Gemini 推出的 Co-Scientist 多智能体科研助手，进一步表明大模型驱动的 MAS 正成为科学发现的新范式（Google DeepMind）。

训练与交互方式革新：OrchRM 提出无需人工标注的奖励建模，可自动评估多智能体编排质量（arXiv）。最新研究还探索了智能体直接读取对方内部状态实现学习（berryxia），以及 Strabo 通过声明式协议兼容 Google UCP 标准，简化智能体间交互（arXiv）。TinyFish 开源的 BigSet 系统则允许用户用自然语言描述快速生成结构化实时数据集（marktechpost），降低了 MAS 应用门槛。

规模化与可靠性研究并行：LangChain 推出的 Deep Agents 架构聚焦于构建可靠的深层次多智能体系统（LangChain）。另一方面，对 LLM 级联中幻觉传播的分析（arXiv: DeepSeek）揭示了多步推理中错误累积的风险，促使社区在设计时更关注鲁棒性。

当前焦点 / 未来观察点

当前 MAS 的研究焦点集中在：如何平衡智能体自主性与人机协作效率，如何设计通用化交互协议（如 Google UCP、Strabo），以及如何缓解级联放大导致的错误。未来需关注 DeepMind 等机构联合发起的 1000 万美元 AI 群体行为研究基金（Google DeepMind）能否推动共识形成，以及开源生态（如 BigSet、Rippling AI）对行业应用的下沉效应。

§ 02相关报道10 条在档

§ 03邻近话题