10:10pandaily@contact@pandaily.com (Pandaily)智谱AI和MiniMax两家中国AI公司的市场估值出现分化,前者估值约200亿元人民币,后者约150亿元。这一走势与全球市场Anthropic(估值约615亿美元)和OpenAI(估值约3000亿美元)的差距扩大相呼应。双方均聚焦于多模态大模型和智能体应用,但融资速度和商业化路径不同。智谱AI以技术开源和B端合作为主,MiniMax则侧重C端产品与海外市场拓展。行业智谱AIMiniMax估值行业格局开源模型10 个信源在谈推荐理由:聊中国AI格局必看这篇,智谱AI和MiniMax谁更像Anthropic和OpenAI,估值数据和背后逻辑都讲清楚了。原文
23:33marktechpost@Asif Razzaq精选MiniMax 发布 Sparse Attention (MSA) 机制,基于 Grouped Query Attention (GQA) 架构。MSA 包含一个轻量级索引分支,为每个查询和 GQA 组选择 Top-k 键值块;主分支仅关注这些块。在 1M 上下文长度下,每个 token 的注意力计算量减少 28.4 倍。该机制训练在 109B 参数的 MoE 模型上,使用 3T token 预算,下游基准测试中与 GQA 性能相当。AI模型MiniMaxMSA稀疏注意力长上下文推荐理由:MiniMax 搞了个新稀疏注意力 MSA,1M 上下文计算量降 28 倍,准度却一点没掉,适合长文本场景。原文
09:09IT之家(博客/媒体)招商银行推出运通工程师信用卡,新用户达标后可每月获18亿Token MiniMax M3用量,支持4-5个Agent并发运行。另有6亿Token方案和MaxClaw云端部署方案可选。该卡面向开发者提供专属AI权益,此前Kimi智能助手也已预告推出Kimi信用卡。行业招商银行运通工程师信用卡MiniMaxTokenAgent推荐理由:招行这张卡直接送MiniMax的18亿Token用量,比Kimi信用卡更早落地,开发者办卡就能用M3模型和Agent并发,省一笔算力钱。原文
09:47IT之家(博客/媒体)精选华为云与MiniMax达成深化合作,基于昇腾算力底座为M3模型提供Tokens算力支持。M3采用MSA注意力架构,支持1M超长上下文,是原生多模态模型,可处理图片、视频输入并操作电脑桌面。在SWE-Bench Pro上,M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;在SVG-Bench上超过Opus 4.7;在OmniDocBench上超过Gemini 3.1 Pro;在Claw-Eval上获得最高分。华为云通过昇腾算力优化MSA算子和MOE均衡,保障M3大规模推理性能。AI模型MiniMaxM3华为云昇腾多模态1 个信源在谈推荐理由:华为云联手MiniMax,M3多模态模型开源原文
11:01IT之家(博客/媒体)根据OpenRouter最新数据,上周全球AI大模型总调用量达36.1万亿Token,中国以14.19万亿Token连续六周超越美国(3.2万亿Token),稳居全球首位。前四名均为国产模型:DeepSeek-V4-Flash蝉联榜首,腾讯Hy3 preview第二,新发布的MiniMaxM3首周冲入前三,小米MiMo-V2.5第四。Claude系列跌出前五,显示国产模型在调用量上已形成明显优势。行业AI大模型调用量DeepSeekMiniMax腾讯1 个信源在谈推荐理由:国产大模型在调用量上持续碾压美国,做模型选型或关注AI生态的开发者值得关注这一趋势,直接反映市场真实需求。原文
16:20IT之家(博客/媒体)MiniMax 因 M3 模型上线后切换 Token 计费方式未提前充分沟通而致歉,并公布了详细的订阅权益保护与档位迁移方案。M3 模型更大、更智能,需要更多算力,因此改用行业统一的 Token-Based 计量。为回馈用户,老用户无周限额权益保留,部分用户获赠额外额度,补偿积分有效期延长至一年。同时公布了 Plus、Max、Ultra 等档位的迁移细节,新增 Ultra 469 元重度档,并确保 M2.7 使用权益不缩水。AI产品MiniMaxM3模型Token计费订阅权益模型迁移推荐理由:MiniMax 这次调整解决了老用户对计费变更的担忧,如果你是 MiniMax 的订阅用户,建议仔细查看自己的档位迁移方案,确保权益不受影响。原文
04:47marktechpost@Asif Razzaq78°MiniMax 正式发布新一代大模型 MiniMax M3,采用自研的 MiniMax Sparse Attention(MSA)架构,支持高达 100 万 token 的超长上下文窗口。该模型原生支持图像、视频理解以及计算机使用(computer use)能力,并具备智能体编程(agentic coding)功能。MSA 架构通过稀疏注意力机制显著降低长序列计算成本,使得处理百万级 token 成为可能。这标志着国产大模型在长上下文和多模态融合方面迈出了重要一步,为复杂文档分析、视频理解和自动化编程等场景提供了新的基础设施。AI模型MiniMaxM3MSA架构长上下文多模态智能体编程推荐理由:MiniMax M3 的 1M 上下文和原生多模态能力直接解决了长文档分析和视频理解的痛点,做 RAG 应用或自动化编程的团队值得关注其 agentic coding 特性。原文
21:50Decoder@Jonathan Kemper78°中国AI公司MiniMax发布了新模型M3,号称是首个结合顶级编码性能、百万token上下文窗口和原生多模态能力的开源权重模型。该模型在多项基准测试中表现优异,尤其在长上下文任务和代码生成方面,直接挑战GPT-4、Claude等闭源模型。M3的开源特性使得开发者可以自由部署和微调,降低了使用门槛。这一发布标志着开源模型在关键能力上正快速追赶闭源方案。AI模型MiniMaxM3开源模型百万token上下文多模态推荐理由:百万token上下文+开源权重,做长文档处理或代码分析的团队可以直接部署,不用再被闭源API的token计费卡脖子。原文
15:16pandaily@contact@pandaily.com (Pandaily)精选83°MiniMax 发布了其旗舰模型 M3,声称这是国内首个将前沿编码、智能体能力、100 万 token 上下文窗口和原生多模态处理整合在单一架构中的 AI 模型。M3 模型在多项基准测试中表现出色,尤其在长文本理解和复杂任务执行方面。该模型支持同时处理文本、图像、音频等多种输入,并具备强大的代码生成和工具调用能力。MiniMax 表示 M3 旨在为开发者和企业提供更高效、更全面的 AI 解决方案。AI模型MiniMaxM3多模态长上下文智能体推荐理由:MiniMax M3 将 1M 上下文、多模态和智能体能力打包进一个模型,做长文本处理或多模态应用的开发者可以直接用它替代多个模型组合,省心又高效。原文
15:39pandaily@contact@pandaily.com (Pandaily)精选中国 AI 独角兽 MiniMax 正在准备推出其下一代 M3 大语言模型,该模型采用自研稀疏注意力机制,声称预填充速度提升 9.7 倍。M3 模型旨在解决长上下文场景下的计算效率瓶颈,通过稀疏化注意力计算减少冗余,从而加速推理并降低资源消耗。这一进展对需要处理超长文本的 AI 应用(如文档分析、对话系统)具有重要意义。MiniMax 预计在 2026 年 5 月正式发布 M3 模型。AI模型MiniMaxM3稀疏注意力大语言模型推理加速推荐理由:稀疏注意力是当前大模型效率优化的关键方向,MiniMax 的 9.7 倍提速对做长文本推理的开发者是直接利好,值得关注其技术细节和开源计划。原文
15:23IT之家(博客/媒体)72°MiniMax 在 X 平台预告即将推出 M3 系列 AI 模型,并转发了一篇关于 M2 系列的 arxiv 论文。M2 系列总参数 229.9B,但每个词元仅激活 9.8B 参数,主打低激活高智能,配备 192K 上下文窗口。论文重点介绍了 M2.7 的自我进化雏形:模型能自主排查训练失败、阅读日志、修改代码,并在内部任务上完成 100 轮自主迭代,吸收团队 30%-50% 的日常迭代工作量。此外,MiniMax 还提出了面向智能体的强化学习系统 Forge,支持白盒与黑盒智能体统一接入,降低长轨迹训练成本。这些进展表明 MiniMax 在高效模型架构和模型自主迭代方面取得重要突破。AI模型MiniMaxM3系列M2系列低激活高智能自我进化推荐理由:MiniMax 的 M2 论文展示了模型开始参与自身开发闭环,做 AI 训练和模型优化的团队值得关注——自我进化能力可能改变模型迭代方式。原文