MiniMax M3 发布：1M 上下文、稀疏注意力、原生多模态

精选理由

MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里，而且计算效率大幅提升，做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试，价格也很友好。

AI 摘要

MiniMax 正式发布大版本模型升级 MiniMax M3，核心亮点包括标配 1M 超长上下文、采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20，大幅提升可落地性。API 价格同步更新，小于 512k 的 API 限时五折（7 天）。模型权重和技术报告将在约 10 天后开源。

AI 翻译 · 中文

歸藏(guizang.ai)MiniMax 这次终于发布了他们的大版本号模型升级 MiniMax M3。主要是三个核心能力： 1. 标配了 1M 的超长上下文 2. 采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构 3. 从训练起就融合了原生多模态能力，包括强化了文本、图片、视频和桌面操作这些多模态的训练。 MSA 超上下文在算力和速度上更可落地，在 100 万上下文下每 token 计算量只有上一代的约 1/20…

岚叔06-01 10:53原文
OpenRouter06-01 02:42原文
Together AI06-02 20:40原文
IT之家06-01 01:24原文
Guillermo Rauch06-01 23:40原文
Browser Use06-01 19:32原文

查看原推