AI模型精选76°

MiniMax-M3 发布:1M上下文+稀疏注意力,押注Agentic Coding

2026-06-01: MiniMax-M3 发布 它是 MiniMax 面向 coding age…

精选理由

M3 的稀疏注意力解决了长上下文推理的成本痛点,做 coding agent 和自动化任务的开发者可以直接关注——1M 上下文下计算量骤降 95%,意味着更长的任务链也能跑得动。

AI 摘要

MiniMax 发布新一代旗舰模型 M3,面向 coding agent、长上下文和多模态任务。M3 支持 1M 上下文,核心技术创新是 MiniMax Sparse Attention (MSA),通过稀疏注意力将 KV 分块并精确选取相关块,大幅降低长上下文计算成本。在 1M 上下文下,每 token 计算量仅为上一代的 1/20,prefill 提速 9 倍以上,decode 提速 15 倍以上。M3 支持文本、图片、视频输入,将长上下文、工具调用、多模态理解和持续执行能力整合,明确押注 agentic coding 场景。

AI 翻译 · 中文

MiniMax 发布新一代旗舰模型 M3,面向 coding agent、长上下文和多模态任务。M3 支持 1M 上下文,核心技术创新是 MiniMax Sparse Attention (MSA),通过稀疏注意力将 KV 分块并精确选取相关块,大幅降低长上下文计算成本。在 1M 上下文下,每 token 计算量仅为上一代的 1/20,prefill 提速 9 倍以上,decode 提速 15 倍以上。M3 支持文本、图片、视频输入,将长上下文、工具调用、多模态理解和持续执行能力整合,明确押注 agentic coding 场景。

岚叔2026-06-01: MiniMax-M3 发布 它是 MiniMax 面向 coding agent、长上下文、多模态任务推出的新一代旗舰模型。追齐了1M 上下文、前沿编码与 agent 能力、原生多模态。 强项在“长程执行”--现在好像都在卷这个,毕竟耗token🐶 M3 最重要的技术点是 MSA,也就是 MiniMax Sparse Attention。 它解决的是 1M 上下文的计算成本问题。传统 full attentio