Agents-A1：35B MoE智能体模型在长视野任务上媲美万亿参数性能

精选理由

35B的模型干翻万亿参数？Agents-A1用长视野扩展和智能体框架做到，基准全面领先，值得看看怎么训练的。

AI 摘要

Agents-A1是一个35B参数的Mixture-of-Experts智能体模型，通过扩展智能体视野（平均轨迹长度45K tokens）达到万亿参数级别性能。它在SEAL-0（56.4）、IFBench（80.6）、HiPhO（46.4）、FrontierScience-Olympiad（79.0）和MolBench-Bind（56.8）上超越了1T参数的Kimi-K2.6和DeepSeek-V4-pro，在SciCode（44.3）、HLE（47.6）和BrowseComp（75.5）上也具有竞争力。训练采用三阶段流程：全领域SFT、领域级教师模型、多教师领域路由在线蒸馏。

AI 翻译 · 中文

arXiv: DeepSeekWe introduce Agents-A1, a 35B Mixture-of-Experts Agentic Model that reaches trillion-parameter-level performance by scaling the agent horizon. We investigate agent-horizon scaling from two perspectives: scaling long-hori…

阅读原文