13:51Together AI@togethercompute精选Together AI 在 X 上演示语音智能体利用屏幕交互的功能。该方案整合了语音转文本(STT)、语音合成和推理,具体使用 Parakeet 进行 STT,MiniMax Speech 2.8 处理语音,MiniMax M3 进行推理。实时系统要求堆叠每一层保持低延迟。演示展示了完整循环在 Together AI 平台上运行。AI产品Together AIParakeetMiniMax Speech 2.8MiniMax M3语音智能体3 个信源在谈推荐理由:Together AI 搞了个语音智能体 demo,能边看屏幕边说话,用了 Parakeet、MiniMax Speech 2.8 和 M3,实时性很强。原文
18:24shao__meng@shao__meng推特用户发起国产四个LLM的投票,GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%,Kimi K2.7为5.2%,MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash,认为其性能不佳导致结果明显。行业GLM-5.2DeepSeek V4Kimi K2.7MiniMax M3国产模型推荐理由:看看社区投票,GLM-5.2碾压式领先,想知道国产模型谁更受认可?结果挺有意思。原文
18:43Together AI@togethercomputeTogether AI 在推文中指出,当团队运行数十亿 tokens 时,缓存、吞吐量和服务效率的微小差异会转化为产品级的经济性。以 MiniMax M3 模型为例,该模型在 Together AI 平台上提供前沿品质和开放模型经济学,其服务栈专为规模化设计。这体现了开放模型在生产中的实际成本竞争力。AI模型MiniMax M3Together AI开放模型推理效率经济性2 个信源在谈推荐理由:看看 Together AI 怎么用 MiniMax M3 把开放模型做大,跑几十亿 tokens 还省钱。不是吹概念,是实打实的缓存和吞吐量优化。原文
18:39Together AI@togethercomputeTogether Compute 测试了闭源和开源模型构建小型可玩游戏的能力。结果显示,开源模型成本更低、速度更快,生成游戏质量接近闭源模型。例如,Opus 4.8 成本是 MiniMax M3 的 15 倍,GPT-5.5 是 Nemotron Ultra 的 10 倍,而 Kimi K2.7 Code 比 Opus 4.8 便宜 7 倍。AI模型Opus 4.8MiniMax M3GPT-5.5开源模型游戏生成5 个信源在谈推荐理由:Together Compute 实测:闭源模型贵几倍,开源做小游戏又快又便宜,质量还接近,想省钱就选开源。原文
13:00Poe@poe_platformPoe 平台上线了 Moonshot AI 的 Kimi K2.7 Code 和 MiniMax 的 M3 两个开放权重模型。Kimi K2.7 Code 是 Moonshot AI 最强的编码模型,支持更智能的多步工具调用,推理效率提升 30%。MiniMax M3 拥有 100 万 token 上下文窗口,支持原生图像和视频输入,专为智能体编码设计。AI产品Kimi K2.7 CodeMiniMax M3PoeMoonshot AI编程助手10 个信源在谈推荐理由:两个开放权重编码模型上线 Poe原文
09:46lmarena.ai@lmarena_aiMiniMax M3 是一款开放权重的模型,现已加入 Agent Arena 平台。Agent Arena 通过真实用户会话评估模型在网页搜索、文件系统和终端工具上的表现,涵盖编写代码、创建幻灯片、研究网页、构建应用和分析文档等任务。排行榜基于 30 万+ 任务、200 万+ 工具调用和 4000 万行代码构建,当前排名第一的是 OpenAI 的 GPT-5.5 (High),第二是 Anthropic 的 Claude-Opus-4.7 (Thinking)。MiniMax M3 的评分即将公布。AI模型MiniMax M3Agent ArenaGPT-5.5Claude-Opus-4.7智能体10 个信源在谈推荐理由:看看 MiniMax M3 在 Agent 任务中能排第几原文
22:47vLLM@vllm_project73°MiniMax AI 发布了新一代开源模型 MiniMax M3,具备前沿的编码和智能体能力,原生支持图像和视频输入、计算机使用功能,并拥有 100 万 token 的上下文窗口。其核心是 MSA(MiniMax Sparse Attention)稀疏注意力架构,通过仅对 top 128-token KV 块进行注意力计算,大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持,可在 NVIDIA 和 AMD 硬件上运行,支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。AI模型MiniMax M3稀疏注意力1M上下文开源模型vLLM10 个信源在谈推荐理由:M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈,做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。原文
11:44lmarena.ai@lmarena_ai精选76°MiniMax M3 模型在 LMSYS Arena 上线,在 Code Arena: Frontend 排名第 7,得分 1531,与 GLM-5.1 不相上下。该模型以每百万 token 输入 0.60 美元、输出 2.40 美元的价格,在其价位上推动了帕累托前沿。MiniMax M3 是首个结合编码与智能体前沿能力的开源权重模型,在 SWE-Bench Pro 上达 59.0%,支持 1M 上下文,并原生支持多模态。权重和技术报告将在约 10 天内发布。AI模型MiniMax M3编码模型开源权重智能体多模态1 个信源在谈推荐理由:MiniMax M3 以极低价格实现了顶级编码性能,做前端开发或智能体应用的团队值得关注,性价比突出。原文
08:23Guillermo Rauch@rauchg76°MiniMax M3 在 Next.js 智能体评测中成为领先的开源模型,性能仅次于 Opus 和 GPT-5,但成本低 10 倍。这是 MiniMax 首个支持多模态输入的长上下文模型。Vercel 宣布 M3 已上线 AI Gateway,并提供一周 50% 折扣。开发者可以以极低成本获得接近顶级模型的智能体能力。AI模型MiniMax M3开源模型智能体Next.js多模态6 个信源在谈推荐理由:做 Next.js 智能体开发的团队终于有了高性价比的开源选择——M3 性能接近 Opus 但成本仅 1/10,Vercel 用户现在就能用上,建议立刻试试。原文
14:50歸藏(guizang.ai)@op7418精选76°MiniMax 正式发布大版本模型升级 MiniMax M3,核心亮点包括标配 1M 超长上下文、采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构,以及从训练起就融合了文本、图片、视频和桌面操作的原生多模态能力。MSA 架构在 100 万上下文下每 token 计算量仅为上一代的约 1/20,大幅提升可落地性。API 价格同步更新,小于 512k 的 API 限时五折(7 天)。模型权重和技术报告将在约 10 天后开源。AI模型MiniMax M3长上下文稀疏注意力多模态API6 个信源在谈推荐理由:MiniMax M3 把长上下文、稀疏注意力和多模态融合做到了一个模型里,而且计算效率大幅提升,做 Agent 开发、多模态应用或长文档处理的团队可以直接用 API 试试,价格也很友好。原文