MiniMax-M3 发布：1M上下文+稀疏注意力，押注Agentic Coding

精选理由

M3 的稀疏注意力解决了长上下文推理的成本痛点，做 coding agent 和自动化任务的开发者可以直接关注——1M 上下文下计算量骤降 95%，意味着更长的任务链也能跑得动。

AI 摘要

MiniMax 发布新一代旗舰模型 M3，面向 coding agent、长上下文和多模态任务。M3 支持 1M 上下文，核心技术创新是 MiniMax Sparse Attention (MSA)，通过稀疏注意力将 KV 分块并精确选取相关块，大幅降低长上下文计算成本。在 1M 上下文下，每 token 计算量仅为上一代的 1/20，prefill 提速 9 倍以上，decode 提速 15 倍以上。M3 支持文本、图片、视频输入，将长上下文、工具调用、多模态理解和持续执行能力整合，明确押注 agentic coding 场景。

AI 翻译 · 中文

岚叔2026-06-01： MiniMax-M3 发布它是 MiniMax 面向 coding agent、长上下文、多模态任务推出的新一代旗舰模型。追齐了1M 上下文、前沿编码与 agent 能力、原生多模态。强项在“长程执行”--现在好像都在卷这个，毕竟耗token🐶 M3 最重要的技术点是 MSA，也就是 MiniMax Sparse Attention。它解决的是 1M 上下文的计算成本问题。传统 full attentio…

歸藏(guizang.ai)06-01 06:01原文
OpenRouter06-01 02:42原文
Together AI06-02 20:40原文
IT之家06-01 01:24原文
Guillermo Rauch06-01 23:40原文
Browser Use06-01 19:32原文

查看原推