21:54AK@_akhaliqhf-claude 工具允许用户在 Claude Code 中切换超过100个开源模型,包括 GLM 5.2、MiniMax-M3 和 DeepSeek v4 Pro。这一集成扩展了 Claude Code 的模型选择范围,用户无需离开 Claude Code 即可利用不同开源模型的能力。该功能主要面向需要灵活使用多种模型的开发者。目前该工具已在 X 上获得 1895 次浏览。AI产品hf-claudeClaude CodeGLM 5.2MiniMax-M3开源模型4 个信源在谈推荐理由:想在 Claude Code 里用别的模型?hf-claude 能直接集成 100+ 开源模型,包括 GLM 5.2 和 DeepSeek v4 Pro,很方便。原文
03:05Together AI@togethercompute精选MiniMax-M3 模型支持智能体携带长历史(超过百万token)、图像、视频、文档和工具输出进入上下文,显著提升多模态信息处理能力。Together 的推理优化通过改进服务路径上的 token 吞吐量,使这一能力在大规模部署时更实用。相比之前方案,每 GPU 可处理更多 token,从而降低每美元自动化工作成本。AI模型MiniMax-M3Together智能体多模态推理优化2 个信源在谈推荐理由:MiniMax-M3 让智能体一口气带进长历史、图、视频、文档和工具输出,Together 优化后每 GPU token 翻倍,自动任务成本更低。原文
10:53Together AI@togethercompute精选MiniMax 发布开源权重原生多模态模型 MiniMax-M3,具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴,通过推理优化在并发场景下实现高达 125% 的吞吐量提升。AI模型MiniMax-M3Together AI多模态开源模型1M上下文7 个信源在谈推荐理由:MiniMax 新模型上线,吞吐量提升 125%原文
22:18LMSYS Org (SGLang)@lmsysorg73°SGLang 宣布 Day-0 支持 MiniMax-M3,这是 MiniMax 推出的原生多模态 MoE 推理模型,总参数量约 428B(活跃参数约 23B),支持文本、图像和视频的融合处理。M3 采用 MiniMax 稀疏注意力机制,在 1M 上下文下相比 M2 实现 9 倍预填充和 15 倍解码加速,每 token 计算量降至 1/20。该模型在编码和协作任务上达到前沿智能体性能,并原生支持 NVIDIA Blackwell 和 AMD MI350X/MI355X 上的 MXFP8 格式。开发者可通过 SGLang 立即运行该模型。AI模型SGLangMiniMax-M3多模态MoE推理模型10 个信源在谈推荐理由:SGLang 第一时间支持 MiniMax-M3,做多模态推理和长上下文应用的团队可以直接上手体验 428B 模型的稀疏注意力加速,编码和智能体任务表现值得一试。原文
04:40Together AI@togethercompute76°MiniMax-M3 是一款结合了 1M 上下文窗口、原生多模态能力和 MiniMax 稀疏注意力机制的新模型。Together 的推理和内核团队通过 KV-block-major 稀疏注意力、分页 MSA 解码、优化索引评分以及 GPU 工作前的多模态预处理,将常见智能体流量下的吞吐量提升了 81-125%。该模型在长上下文和多模态任务上表现出色,适合需要处理大量信息和多种数据类型的应用场景。AI模型MiniMax-M3稀疏注意力多模态长上下文推理优化7 个信源在谈推荐理由:做长上下文和多模态应用的团队可以关注——MiniMax-M3 的稀疏注意力优化让吞吐量提升显著,直接降低推理成本,值得一试。原文
18:53岚叔@lufzzliz精选76°MiniMax 发布新一代旗舰模型 M3,面向 coding agent、长上下文和多模态任务。M3 支持 1M 上下文,核心技术创新是 MiniMax Sparse Attention (MSA),通过稀疏注意力将 KV 分块并精确选取相关块,大幅降低长上下文计算成本。在 1M 上下文下,每 token 计算量仅为上一代的 1/20,prefill 提速 9 倍以上,decode 提速 15 倍以上。M3 支持文本、图片、视频输入,将长上下文、工具调用、多模态理解和持续执行能力整合,明确押注 agentic coding 场景。AI模型MiniMax-M3稀疏注意力长上下文Agentic Coding多模态6 个信源在谈推荐理由:M3 的稀疏注意力解决了长上下文推理的成本痛点,做 coding agent 和自动化任务的开发者可以直接关注——1M 上下文下计算量骤降 95%,意味着更长的任务链也能跑得动。原文
11:11OpenRouter@OpenRouterAI精选76°MiniMax-M3 是一款前沿开源权重模型,已在 OpenRouter 平台上线。它集成了 100 万 token 的超长上下文窗口、顶尖的编程与智能体能力,以及原生支持图像和视频的多模态处理。该模型在编码和智能体任务上表现卓越,同时保持了开源特性,为开发者和研究者提供了强大的工具。其 1M token 上下文窗口尤其适合处理长文档、复杂代码库和多模态数据融合场景。AI模型MiniMax-M3开源模型长上下文多模态编程助手6 个信源在谈推荐理由:MiniMax-M3 把长上下文、强编码和多模态塞进一个开源模型里,做复杂智能体或长文档处理的团队可以直接在 OpenRouter 上试,省去自己部署的麻烦。原文