AI 初创公司 MiniMax 在 2025 年 5 月发布了其最新的大模型 M3,该模型在技术架构与能力维度上均实现了显著突破,被视为开源社区的重要进展。M3 主打三大亮点:融合编码、智能体与多模态能力,支持原生多模态输入,并具备高达 1M(百万)的上下文窗口。据官方及多家媒体报道,M3 采用的稀疏注意力机制使其在长文本处理上速度提升近 10 倍,同时编码与智能体任务表现突出。
- 近期主要进展包括:
- M3 正式发布并开源:MiniMax M3 作为首个融合编码、智能体与多模态的开源模型上线,并在 OpenRouter、lmarena 等平台部署,支持 1M 上下文和原生多模态推理(OpenRouter、OpenRouter、lmarena.ai)。
- 技术细节与性能提升:M3 采用 MiniMax 自研的稀疏注意力架构(MSA),据称推理速度提升 9.7 倍,且百万上下文支持在编码、智能体规划等场景中展现优势(IT之家、pandaily)。
- 前序模型 M2 论文披露:在 M3 发布前,MiniMax 公开了 M2 论文,揭示其具备自我进化能力,为 M3 的技术积累提供了背景(berryxia、IT之家)。
当前焦点集中在 M3 的开源策略与性能实测上。相较于闭源模型,M3 的开源性质使其在开发者社区迅速获得关注,尤其长上下文和多模态能力被视为对标 GPT-4 等竞品的重要差异化优势。未来观察点在于:M3 能否在复杂编码和智能体任务中持续领先,以及其稀疏注意力架构是否会被其他模型效仿。此外,M3 的应用落地情况(如与支付宝等企业合作的可能性)也值得关注。