全部 AI 动态 · AI 热点

6月29日

16:31

16:31

Pandaily@contact@pandaily.com (Pandaily)

中国AI大模型API调用量连续九周位居全球第一。DeepSeek-V4-Flash、MiMo-V2.5和MiniMax M3是调用量最高的三个模型。同期美国市场份额从72%暴跌至33%，中国模型的API调用优势正在扩大。

行业 DeepSeek-V4-Flash MiMo-V2.5 MiniMax M3 API调用量市场份额

推荐理由：中国AI模型API调用量九周全球第一，DeepSeek、MiMo、MiniMax这些国产模型很猛，美国份额从72%掉到33%，值得看看。

13:51

13:51

Together AI@togethercompute

精选

Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本（STT）、语音合成和推理，具体使用 Parakeet 进行 STT，MiniMax Speech 2.8 处理语音，MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。

AI产品 Together AI Parakeet MiniMax Speech 2.8 MiniMax M3 语音智能体

推荐理由：Together AI 搞了个语音智能体 demo，能边看屏幕边说话，用了 Parakeet、MiniMax Speech 2.8 和 M3，实时性很强。

6月22日

18:24

18:24

shao__meng@shao__meng

推特用户发起国产四个LLM的投票，GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%，Kimi K2.7为5.2%，MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash，认为其性能不佳导致结果明显。

行业 GLM-5.2 DeepSeek V4 Kimi K2.7 MiniMax M3 国产模型

推荐理由：看看社区投票，GLM-5.2碾压式领先，想知道国产模型谁更受认可？结果挺有意思。

6月19日

18:43

18:43

Together AI@togethercompute

Together AI 在推文中指出，当团队运行数十亿 tokens 时，缓存、吞吐量和服务效率的微小差异会转化为产品级的经济性。以 MiniMax M3 模型为例，该模型在 Together AI 平台上提供前沿品质和开放模型经济学，其服务栈专为规模化设计。这体现了开放模型在生产中的实际成本竞争力。

AI模型 MiniMax M3 Together AI 开放模型推理效率经济性

推荐理由：看看 Together AI 怎么用 MiniMax M3 把开放模型做大，跑几十亿 tokens 还省钱。不是吹概念，是实打实的缓存和吞吐量优化。

18:39

18:39

Together AI@togethercompute

Together Compute 测试了闭源和开源模型构建小型可玩游戏的能力。结果显示，开源模型成本更低、速度更快，生成游戏质量接近闭源模型。例如，Opus 4.8 成本是 MiniMax M3 的 15 倍，GPT-5.5 是 Nemotron Ultra 的 10 倍，而 Kimi K2.7 Code 比 Opus 4.8 便宜 7 倍。

AI模型 Opus 4.8 MiniMax M3 GPT-5.5 开源模型游戏生成

推荐理由：Together Compute 实测：闭源模型贵几倍，开源做小游戏又快又便宜，质量还接近，想省钱就选开源。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

23:15

23:15IT之家（博客/媒体）

78°

稀宇科技于6月12日开源了 MiniMax M3 模型权重，总参数428B，激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型，支持百万上下文。发布两周后，M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS，后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平，具备自主任务拆解、工具调用与多步推理能力。

AI模型 MiniMax M3 多模态开源模型百万上下文智能体

推荐理由：MiniMax 开源了原生多模态巨无霸 M3，428B参数、百万上下文，全球开源排名第一，还能自主拆任务调工具，速度从30飙到80 TPS。

6月13日

13:23

13:23IT之家（博客/媒体）

6月12日，MiniMax 开源了新一代原生多模态旗舰模型 M3。同日，摩尔线程宣布其旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。MTT S5000 凭借硬件级原生 FP8 加速，单卡 AI 算力（稠密）高达 1000 TFLOPS，配备 80GB 显存与 1.6TB/s 带宽，支撑百万 token 级长序列。适配通过原生算子定制提升推理吞吐并降低延迟，同时同步拉起 vLLM 与 SGLang 两大推理框架。

AI模型 MiniMax M3 摩尔线程 MTT S5000 多模态推理框架

推荐理由：摩尔线程让国产模型跑得更快

13:00

13:00

Poe@poe_platform

Poe 平台上线了 Moonshot AI 的 Kimi K2.7 Code 和 MiniMax 的 M3 两个开放权重模型。Kimi K2.7 Code 是 Moonshot AI 最强的编码模型，支持更智能的多步工具调用，推理效率提升 30%。MiniMax M3 拥有 100 万 token 上下文窗口，支持原生图像和视频输入，专为智能体编码设计。

AI产品 Kimi K2.7 Code MiniMax M3 Poe Moonshot AI 编程助手

推荐理由：两个开放权重编码模型上线 Poe

09:46

09:46

lmarena.ai@lmarena_ai

MiniMax M3 是一款开放权重的模型，现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现，涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建，当前排名第一的是 OpenAI 的 GPT-5.5 (High)，第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。

AI模型 MiniMax M3 Agent Arena GPT-5.5 Claude-Opus-4.7 智能体

推荐理由：看看 MiniMax M3 在 Agent 任务中能排第几

6月12日

22:47

22:47

vLLM@vllm_project

73°

MiniMax AI 发布了新一代开源模型 MiniMax M3，具备前沿的编码和智能体能力，原生支持图像和视频输入、计算机使用功能，并拥有 100 万 token 的上下文窗口。其核心是 MSA（MiniMax Sparse Attention）稀疏注意力架构，通过仅对 top 128-token KV 块进行注意力计算，大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持，可在 NVIDIA 和 AMD 硬件上运行，支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。

AI模型 MiniMax M3 稀疏注意力 1M上下文开源模型 vLLM

推荐理由：M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈，做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月8日

15:49

15:49

Pandaily@contact@pandaily.com (Pandaily)

76°

根据OpenRouter数据，中国AI模型在API调用量上已连续六周超过美国，其中DeepSeek-V4-Flash位居榜首，MiniMax M3首次进入全球前三。这一趋势显示中国AI模型在应用层面正快速追赶并超越美国，尤其在性价比和实用性上获得开发者青睐。MiniMax M3的崛起标志着中国AI生态的多元化，不再仅依赖单一模型。

行业中国AI API调用量 DeepSeek-V4-Flash MiniMax M3 OpenRouter

推荐理由：中国AI模型在API调用量上持续领先美国，说明国产模型在实用性和成本上已获开发者认可，做AI应用或模型选型的团队值得关注这一趋势，MiniMax M3的突破尤其值得一试。

6月4日

11:44

11:44

lmarena.ai@lmarena_ai

精选76°

MiniMax M3 模型在 LMSYS Arena 上线，在 Code Arena: Frontend 排名第 7，得分 1531，与 GLM-5.1 不相上下。该模型以每百万 token 输入 0.60 美元、输出 2.40 美元的价格，在其价位上推动了帕累托前沿。MiniMax M3 是首个结合编码与智能体前沿能力的开源权重模型，在 SWE-Bench Pro 上达 59.0%，支持 1M 上下文，并原生支持多模态。权重和技术报告将在约 10 天内发布。

AI模型 MiniMax M3 编码模型开源权重智能体多模态

推荐理由：MiniMax M3 以极低价格实现了顶级编码性能，做前端开发或智能体应用的团队值得关注，性价比突出。

6月2日

08:23

08:23

Guillermo Rauch@rauchg

76°

MiniMax M3 在 Next.js 智能体评测中成为领先的开源模型，性能仅次于 Opus 和 GPT-5，但成本低 10 倍。这是 MiniMax 首个支持多模态输入的长上下文模型。Vercel 宣布 M3 已上线 AI Gateway，并提供一周 50% 折扣。开发者可以以极低成本获得接近顶级模型的智能体能力。

AI模型 MiniMax M3 开源模型智能体 Next.js 多模态

推荐理由：做 Next.js 智能体开发的团队终于有了高性价比的开源选择——M3 性能接近 Opus 但成本仅 1/10，Vercel 用户现在就能用上，建议立刻试试。

6月1日

14:50

14:50

歸藏(guizang.ai)@op7418

精选76°

MiniMax 正式发布大版本模型升级 MiniMax M3，核心亮点包括标配 1M 超长上下文、采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20，大幅提升可落地性。API 价格同步更新，小于 512k 的 API 限时五折（7 天）。模型权重和技术报告将在约 10 天后开源。

AI模型 MiniMax M3 长上下文稀疏注意力多模态 API

推荐理由：MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里，而且计算效率大幅提升，做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试，价格也很友好。

10:02

10:02IT之家（博客/媒体）

78°

MiniMax 稀宇科技发布了旗舰模型 M3，宣称是首个同时具备前沿编码与智能体能力、百万上下文和原生多模态的国产模型。M3 在编码与智能体评测中达到行业顶尖水平，能自主拆解任务、调用工具和多步推理，API 最高支持 1M tokens 上下文窗口。在 BrowseComp 智能体评测中，M3 以 83.5 分超越 Opus 4.7。M3 是原生多模态模型，从预训练阶段就进行多模态训练，使文本和视觉语义高度对齐。MiniMax 还展示了 M3 独立复现 ICLR 论文和自主训练四个 Base 模型的能力。API 已上线，提供标准版和高速版，价格有 7 天限时五折优惠，模型即将开源。

AI模型 MiniMax M3 国产旗舰模型百万上下文原生多模态编码与智能体

推荐理由：MiniMax M3 把编码、智能体、长上下文和多模态全塞进一个模型，做复杂自动化或长视频分析的开发者可以直接试，价格还有限时折扣。