全部 AI 动态 · AI 热点

6月29日

13:51

13:51

Together AI@togethercompute

精选

Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本（STT）、语音合成和推理，具体使用 Parakeet 进行 STT，MiniMax Speech 2.8 处理语音，MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。

AI产品 Together AI Parakeet MiniMax Speech 2.8 MiniMax M3 语音智能体

推荐理由：Together AI 搞了个语音智能体 demo，能边看屏幕边说话，用了 Parakeet、MiniMax Speech 2.8 和 M3，实时性很强。

6月22日

18:24

18:24

shao__meng@shao__meng

推特用户发起国产四个LLM的投票，GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%，Kimi K2.7为5.2%，MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash，认为其性能不佳导致结果明显。

行业 GLM-5.2 DeepSeek V4 Kimi K2.7 MiniMax M3 国产模型

推荐理由：看看社区投票，GLM-5.2碾压式领先，想知道国产模型谁更受认可？结果挺有意思。

6月19日

18:43

18:43

Together AI@togethercompute

Together AI 在推文中指出，当团队运行数十亿 tokens 时，缓存、吞吐量和服务效率的微小差异会转化为产品级的经济性。以 MiniMax M3 模型为例，该模型在 Together AI 平台上提供前沿品质和开放模型经济学，其服务栈专为规模化设计。这体现了开放模型在生产中的实际成本竞争力。

AI模型 MiniMax M3 Together AI 开放模型推理效率经济性

推荐理由：看看 Together AI 怎么用 MiniMax M3 把开放模型做大，跑几十亿 tokens 还省钱。不是吹概念，是实打实的缓存和吞吐量优化。

18:39

18:39

Together AI@togethercompute

Together Compute 测试了闭源和开源模型构建小型可玩游戏的能力。结果显示，开源模型成本更低、速度更快，生成游戏质量接近闭源模型。例如，Opus 4.8 成本是 MiniMax M3 的 15 倍，GPT-5.5 是 Nemotron Ultra 的 10 倍，而 Kimi K2.7 Code 比 Opus 4.8 便宜 7 倍。

AI模型 Opus 4.8 MiniMax M3 GPT-5.5 开源模型游戏生成

推荐理由：Together Compute 实测：闭源模型贵几倍，开源做小游戏又快又便宜，质量还接近，想省钱就选开源。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

13:00

13:00

Poe@poe_platform

Poe 平台上线了 Moonshot AI 的 Kimi K2.7 Code 和 MiniMax 的 M3 两个开放权重模型。Kimi K2.7 Code 是 Moonshot AI 最强的编码模型，支持更智能的多步工具调用，推理效率提升 30%。MiniMax M3 拥有 100 万 token 上下文窗口，支持原生图像和视频输入，专为智能体编码设计。

AI产品 Kimi K2.7 Code MiniMax M3 Poe Moonshot AI 编程助手

推荐理由：两个开放权重编码模型上线 Poe

09:46

09:46

lmarena.ai@lmarena_ai

MiniMax M3 是一款开放权重的模型，现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现，涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建，当前排名第一的是 OpenAI 的 GPT-5.5 (High)，第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。

AI模型 MiniMax M3 Agent Arena GPT-5.5 Claude-Opus-4.7 智能体

推荐理由：看看 MiniMax M3 在 Agent 任务中能排第几

6月12日

22:47

22:47

vLLM@vllm_project

73°

MiniMax AI 发布了新一代开源模型 MiniMax M3，具备前沿的编码和智能体能力，原生支持图像和视频输入、计算机使用功能，并拥有 100 万 token 的上下文窗口。其核心是 MSA（MiniMax Sparse Attention）稀疏注意力架构，通过仅对 top 128-token KV 块进行注意力计算，大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持，可在 NVIDIA 和 AMD 硬件上运行，支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。

AI模型 MiniMax M3 稀疏注意力 1M上下文开源模型 vLLM

推荐理由：M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈，做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

11:44

11:44

lmarena.ai@lmarena_ai

精选76°

MiniMax M3 模型在 LMSYS Arena 上线，在 Code Arena: Frontend 排名第 7，得分 1531，与 GLM-5.1 不相上下。该模型以每百万 token 输入 0.60 美元、输出 2.40 美元的价格，在其价位上推动了帕累托前沿。MiniMax M3 是首个结合编码与智能体前沿能力的开源权重模型，在 SWE-Bench Pro 上达 59.0%，支持 1M 上下文，并原生支持多模态。权重和技术报告将在约 10 天内发布。

AI模型 MiniMax M3 编码模型开源权重智能体多模态

推荐理由：MiniMax M3 以极低价格实现了顶级编码性能，做前端开发或智能体应用的团队值得关注，性价比突出。

6月2日

08:23

08:23

Guillermo Rauch@rauchg

76°

MiniMax M3 在 Next.js 智能体评测中成为领先的开源模型，性能仅次于 Opus 和 GPT-5，但成本低 10 倍。这是 MiniMax 首个支持多模态输入的长上下文模型。Vercel 宣布 M3 已上线 AI Gateway，并提供一周 50% 折扣。开发者可以以极低成本获得接近顶级模型的智能体能力。

AI模型 MiniMax M3 开源模型智能体 Next.js 多模态

推荐理由：做 Next.js 智能体开发的团队终于有了高性价比的开源选择——M3 性能接近 Opus 但成本仅 1/10，Vercel 用户现在就能用上，建议立刻试试。

6月1日

14:50

14:50

歸藏(guizang.ai)@op7418

精选76°

MiniMax 正式发布大版本模型升级 MiniMax M3，核心亮点包括标配 1M 超长上下文、采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20，大幅提升可落地性。API 价格同步更新，小于 512k 的 API 限时五折（7 天）。模型权重和技术报告将在约 10 天后开源。

AI模型 MiniMax M3 长上下文稀疏注意力多模态 API

推荐理由：MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里，而且计算效率大幅提升，做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试，价格也很友好。