Experts

§ 01综述

在人工智能领域，Experts 特指混合专家模型（Mixture of Experts, MoE）中的子网络模块；每个 Expert 负责处理特定类型的输入，通过路由器动态组合，以实现高效的大规模模型推理。近期，MoE 架构在提升推理效率、扩展模型规模以及改进路由策略方面取得了显著进展。

MoE中Experts的近期进展

Agents-A1：35B参数MoE智能体模型：2026年6月，DeepSeek 发布 Agents-A1，该模型仅35B参数，但在长视野任务上性能媲美万亿参数模型，证明了稀疏MoE在智能体场景中的潜力。arXiv

CAEE：成本感知的专家执行框架：同一团队提出 CAEE，通过动态调整不同Experts的激活粒度，在多个设备上优化MoE推理延迟，最高可减少40%计算成本。arXiv

MPI方法重新设计MoE路由器：研究团队发现传统路由器倾向于随机分配Experts，而MPI方法通过对齐专家主奇异方向，使路由更有序，在多个语言任务上提升准确率2-5%。arXiv

Prime Intellect发布prime-rl 0.6.0：2026年6月23日，Prime Intellect 更新其强化学习框架，支持训练万亿参数MoE模型，允许Experts在智能体RL工作负载上协同学习。MarkTechPost

Experts当前焦点与观察点

当前Experts领域的核心争议在于专家分配与负载均衡。Hebbia CTO指出，70%的企业AI部署失败源于错误使用方式，包括过度依赖单一Experts或忽略路由器优化。另一方面，SARA（语义锚定路由对齐）方法尝试解锁MoE的多语言知识，通过语义锚定减少Experts间知识冲突。然而，动态MoE（如dMoE）引入可学习块专家，进一步增加了架构复杂度。业界普遍认为，如何在不增加推理开销的前提下提升Experts的 specialization（专业化）仍是最关键挑战，而vLLM、Cohere等工业级框架的快速支持表明，Experts正从研究走向工程落地。

§ 02相关报道10 条在档

§ 03邻近话题