09:47IT之家(博客/媒体)精选华为云与MiniMax达成深化合作,基于昇腾算力底座为M3模型提供Tokens算力支持。M3采用MSA注意力架构,支持1M超长上下文,是原生多模态模型,可处理图片、视频输入并操作电脑桌面。在SWE-Bench Pro上,M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;在SVG-Bench上超过Opus 4.7;在OmniDocBench上超过Gemini 3.1 Pro;在Claw-Eval上获得最高分。华为云通过昇腾算力优化MSA算子和MOE均衡,保障M3大规模推理性能。AI模型MiniMaxM3华为云昇腾多模态1 个信源在谈推荐理由:华为云联手MiniMax,M3多模态模型开源原文
04:47marktechpost@Asif Razzaq78°MiniMax 正式发布新一代大模型 MiniMax M3,采用自研的 MiniMax Sparse Attention(MSA)架构,支持高达 100 万 token 的超长上下文窗口。该模型原生支持图像、视频理解以及计算机使用(computer use)能力,并具备智能体编程(agentic coding)功能。MSA 架构通过稀疏注意力机制显著降低长序列计算成本,使得处理百万级 token 成为可能。这标志着国产大模型在长上下文和多模态融合方面迈出了重要一步,为复杂文档分析、视频理解和自动化编程等场景提供了新的基础设施。AI模型MiniMaxM3MSA架构长上下文多模态智能体编程推荐理由:MiniMax M3 的 1M 上下文和原生多模态能力直接解决了长文档分析和视频理解的痛点,做 RAG 应用或自动化编程的团队值得关注其 agentic coding 特性。原文
21:50Decoder@Jonathan Kemper78°中国AI公司MiniMax发布了新模型M3,号称是首个结合顶级编码性能、百万token上下文窗口和原生多模态能力的开源权重模型。该模型在多项基准测试中表现优异,尤其在长上下文任务和代码生成方面,直接挑战GPT-4、Claude等闭源模型。M3的开源特性使得开发者可以自由部署和微调,降低了使用门槛。这一发布标志着开源模型在关键能力上正快速追赶闭源方案。AI模型MiniMaxM3开源模型百万token上下文多模态推荐理由:百万token上下文+开源权重,做长文档处理或代码分析的团队可以直接部署,不用再被闭源API的token计费卡脖子。原文
15:16pandaily@contact@pandaily.com (Pandaily)精选83°MiniMax 发布了其旗舰模型 M3,声称这是国内首个将前沿编码、智能体能力、100 万 token 上下文窗口和原生多模态处理整合在单一架构中的 AI 模型。M3 模型在多项基准测试中表现出色,尤其在长文本理解和复杂任务执行方面。该模型支持同时处理文本、图像、音频等多种输入,并具备强大的代码生成和工具调用能力。MiniMax 表示 M3 旨在为开发者和企业提供更高效、更全面的 AI 解决方案。AI模型MiniMaxM3多模态长上下文智能体推荐理由:MiniMax M3 将 1M 上下文、多模态和智能体能力打包进一个模型,做长文本处理或多模态应用的开发者可以直接用它替代多个模型组合,省心又高效。原文
15:39pandaily@contact@pandaily.com (Pandaily)精选中国 AI 独角兽 MiniMax 正在准备推出其下一代 M3 大语言模型,该模型采用自研稀疏注意力机制,声称预填充速度提升 9.7 倍。M3 模型旨在解决长上下文场景下的计算效率瓶颈,通过稀疏化注意力计算减少冗余,从而加速推理并降低资源消耗。这一进展对需要处理超长文本的 AI 应用(如文档分析、对话系统)具有重要意义。MiniMax 预计在 2026 年 5 月正式发布 M3 模型。AI模型MiniMaxM3稀疏注意力大语言模型推理加速推荐理由:稀疏注意力是当前大模型效率优化的关键方向,MiniMax 的 9.7 倍提速对做长文本推理的开发者是直接利好,值得关注其技术细节和开源计划。原文