训练与交互方式革新:OrchRM 提出无需人工标注的奖励建模,可自动评估多智能体编排质量(arXiv)。最新研究还探索了智能体直接读取对方内部状态实现学习(berryxia),以及 Strabo 通过声明式协议兼容 Google UCP 标准,简化智能体间交互(arXiv)。TinyFish 开源的 BigSet 系统则允许用户用自然语言描述快速生成结构化实时数据集(marktechpost),降低了 MAS 应用门槛。
规模化与可靠性研究并行:LangChain 推出的 Deep Agents 架构聚焦于构建可靠的深层次多智能体系统(LangChain)。另一方面,对 LLM 级联中幻觉传播的分析(arXiv: DeepSeek)揭示了多步推理中错误累积的风险,促使社区在设计时更关注鲁棒性。
当前焦点 / 未来观察点
当前 MAS 的研究焦点集中在:如何平衡智能体自主性与人机协作效率,如何设计通用化交互协议(如 Google UCP、Strabo),以及如何缓解级联放大导致的错误。未来需关注 DeepMind 等机构联合发起的 1000 万美元 AI 群体行为研究基金(Google DeepMind)能否推动共识形成,以及开源生态(如 BigSet、Rippling AI)对行业应用的下沉效应。