16:31Pandaily@contact@pandaily.com (Pandaily)中国AI大模型API调用量连续九周位居全球第一。DeepSeek-V4-Flash、MiMo-V2.5和MiniMax M3是调用量最高的三个模型。同期美国市场份额从72%暴跌至33%,中国模型的API调用优势正在扩大。行业DeepSeek-V4-FlashMiMo-V2.5MiniMax M3API调用量市场份额3 个信源在谈推荐理由:中国AI模型API调用量九周全球第一,DeepSeek、MiMo、MiniMax这些国产模型很猛,美国份额从72%掉到33%,值得看看。原文
13:51Together AI@togethercompute精选Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本(STT)、语音合成和推理,具体使用 Parakeet 进行 STT,MiniMax Speech 2.8 处理语音,MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。AI产品Together AIParakeetMiniMax Speech 2.8MiniMax M3语音智能体3 个信源在谈推荐理由:Together AI 搞了个语音智能体 demo,能边看屏幕边说话,用了 Parakeet、MiniMax Speech 2.8 和 M3,实时性很强。原文
18:24shao__meng@shao__meng推特用户发起国产四个LLM的投票,GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%,Kimi K2.7为5.2%,MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash,认为其性能不佳导致结果明显。行业GLM-5.2DeepSeek V4Kimi K2.7MiniMax M3国产模型推荐理由:看看社区投票,GLM-5.2碾压式领先,想知道国产模型谁更受认可?结果挺有意思。原文
18:43Together AI@togethercomputeTogether AI 在推文中指出,当团队运行数十亿 tokens 时,缓存、吞吐量和服务效率的微小差异会转化为产品级的经济性。以 MiniMax M3 模型为例,该模型在 Together AI 平台上提供前沿品质和开放模型经济学,其服务栈专为规模化设计。这体现了开放模型在生产中的实际成本竞争力。AI模型MiniMax M3Together AI开放模型推理效率经济性2 个信源在谈推荐理由:看看 Together AI 怎么用 MiniMax M3 把开放模型做大,跑几十亿 tokens 还省钱。不是吹概念,是实打实的缓存和吞吐量优化。原文
18:39Together AI@togethercomputeTogether Compute 测试了闭源和开源模型构建小型可玩游戏的能力。结果显示,开源模型成本更低、速度更快,生成游戏质量接近闭源模型。例如,Opus 4.8 成本是 MiniMax M3 的 15 倍,GPT-5.5 是 Nemotron Ultra 的 10 倍,而 Kimi K2.7 Code 比 Opus 4.8 便宜 7 倍。AI模型Opus 4.8MiniMax M3GPT-5.5开源模型游戏生成5 个信源在谈推荐理由:Together Compute 实测:闭源模型贵几倍,开源做小游戏又快又便宜,质量还接近,想省钱就选开源。原文
23:15IT之家(博客/媒体)78°稀宇科技于6月12日开源了 MiniMax M3 模型权重,总参数428B,激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型,支持百万上下文。发布两周后,M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS,后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平,具备自主任务拆解、工具调用与多步推理能力。AI模型MiniMax M3多模态开源模型百万上下文智能体2 个信源在谈推荐理由:MiniMax 开源了原生多模态巨无霸 M3,428B参数、百万上下文,全球开源排名第一,还能自主拆任务调工具,速度从30飙到80 TPS。原文
13:23IT之家(博客/媒体)6月12日,MiniMax 开源了新一代原生多模态旗舰模型 M3。同日,摩尔线程宣布其旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。MTT S5000 凭借硬件级原生 FP8 加速,单卡 AI 算力(稠密)高达 1000 TFLOPS,配备 80GB 显存与 1.6TB/s 带宽,支撑百万 token 级长序列。适配通过原生算子定制提升推理吞吐并降低延迟,同时同步拉起 vLLM 与 SGLang 两大推理框架。AI模型MiniMax M3摩尔线程MTT S5000多模态推理框架7 个信源在谈推荐理由:摩尔线程让国产模型跑得更快原文
13:00Poe@poe_platformPoe 平台上线了 Moonshot AI 的 Kimi K2.7 Code 和 MiniMax 的 M3 两个开放权重模型。Kimi K2.7 Code 是 Moonshot AI 最强的编码模型,支持更智能的多步工具调用,推理效率提升 30%。MiniMax M3 拥有 100 万 token 上下文窗口,支持原生图像和视频输入,专为智能体编码设计。AI产品Kimi K2.7 CodeMiniMax M3PoeMoonshot AI编程助手10 个信源在谈推荐理由:两个开放权重编码模型上线 Poe原文
09:46lmarena.ai@lmarena_aiMiniMax M3 是一款开放权重的模型,现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现,涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建,当前排名第一的是 OpenAI 的 GPT-5.5 (High),第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。AI模型MiniMax M3Agent ArenaGPT-5.5Claude-Opus-4.7智能体10 个信源在谈推荐理由:看看 MiniMax M3 在 Agent 任务中能排第几原文
22:47vLLM@vllm_project73°MiniMax AI 发布了新一代开源模型 MiniMax M3,具备前沿的编码和智能体能力,原生支持图像和视频输入、计算机使用功能,并拥有 100 万 token 的上下文窗口。其核心是 MSA(MiniMax Sparse Attention)稀疏注意力架构,通过仅对 top 128-token KV 块进行注意力计算,大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持,可在 NVIDIA 和 AMD 硬件上运行,支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。AI模型MiniMax M3稀疏注意力1M上下文开源模型vLLM10 个信源在谈推荐理由:M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈,做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。原文
15:49Pandaily@contact@pandaily.com (Pandaily)76°根据OpenRouter数据,中国AI模型在API调用量上已连续六周超过美国,其中DeepSeek-V4-Flash位居榜首,MiniMax M3首次进入全球前三。这一趋势显示中国AI模型在应用层面正快速追赶并超越美国,尤其在性价比和实用性上获得开发者青睐。MiniMax M3的崛起标志着中国AI生态的多元化,不再仅依赖单一模型。行业中国AIAPI调用量DeepSeek-V4-FlashMiniMax M3OpenRouter1 个信源在谈推荐理由:中国AI模型在API调用量上持续领先美国,说明国产模型在实用性和成本上已获开发者认可,做AI应用或模型选型的团队值得关注这一趋势,MiniMax M3的突破尤其值得一试。原文
11:44lmarena.ai@lmarena_ai精选76°MiniMax M3 模型在 LMSYS Arena 上线,在 Code Arena: Frontend 排名第 7,得分 1531,与 GLM-5.1 不相上下。该模型以每百万 token 输入 0.60 美元、输出 2.40 美元的价格,在其价位上推动了帕累托前沿。MiniMax M3 是首个结合编码与智能体前沿能力的开源权重模型,在 SWE-Bench Pro 上达 59.0%,支持 1M 上下文,并原生支持多模态。权重和技术报告将在约 10 天内发布。AI模型MiniMax M3编码模型开源权重智能体多模态1 个信源在谈推荐理由:MiniMax M3 以极低价格实现了顶级编码性能,做前端开发或智能体应用的团队值得关注,性价比突出。原文
08:23Guillermo Rauch@rauchg76°MiniMax M3 在 Next.js 智能体评测中成为领先的开源模型,性能仅次于 Opus 和 GPT-5,但成本低 10 倍。这是 MiniMax 首个支持多模态输入的长上下文模型。Vercel 宣布 M3 已上线 AI Gateway,并提供一周 50% 折扣。开发者可以以极低成本获得接近顶级模型的智能体能力。AI模型MiniMax M3开源模型智能体Next.js多模态6 个信源在谈推荐理由:做 Next.js 智能体开发的团队终于有了高性价比的开源选择——M3 性能接近 Opus 但成本仅 1/10,Vercel 用户现在就能用上,建议立刻试试。原文
14:50歸藏(guizang.ai)@op7418精选76°MiniMax 正式发布大版本模型升级 MiniMax M3,核心亮点包括标配 1M 超长上下文、采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构,以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20,大幅提升可落地性。API 价格同步更新,小于 512k 的 API 限时五折(7 天)。模型权重和技术报告将在约 10 天后开源。AI模型MiniMax M3长上下文稀疏注意力多模态API6 个信源在谈推荐理由:MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里,而且计算效率大幅提升,做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试,价格也很友好。原文
10:02IT之家(博客/媒体)78°MiniMax 稀宇科技发布了旗舰模型 M3,宣称是首个同时具备前沿编码与智能体能力、百万上下文和原生多模态的国产模型。M3 在编码与智能体评测中达到行业顶尖水平,能自主拆解任务、调用工具和多步推理,API 最高支持 1M tokens 上下文窗口。在 BrowseComp 智能体评测中,M3 以 83.5 分超越 Opus 4.7。M3 是原生多模态模型,从预训练阶段就进行多模态训练,使文本和视觉语义高度对齐。MiniMax 还展示了 M3 独立复现 ICLR 论文和自主训练四个 Base 模型的能力。API 已上线,提供标准版和高速版,价格有 7 天限时五折优惠,模型即将开源。AI模型MiniMax M3国产旗舰模型百万上下文原生多模态编码与智能体6 个信源在谈推荐理由:MiniMax M3 把编码、智能体、长上下文和多模态全塞进一个模型,做复杂自动化或长视频分析的开发者可以直接试,价格还有限时折扣。原文