摩尔线程 MTT S5000 完成 MiniMax M3 模型 Day-0 适配

精选理由

摩尔线程让国产模型跑得更快

AI 摘要

6月12日，MiniMax 开源了新一代原生多模态旗舰模型 M3。同日，摩尔线程宣布其旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。MTT S5000 凭借硬件级原生 FP8 加速，单卡 AI 算力（稠密）高达 1000 TFLOPS，配备 80GB 显存与 1.6TB/s 带宽，支撑百万 token 级长序列。适配通过原生算子定制提升推理吞吐并降低延迟，同时同步拉起 vLLM 与 SGLang 两大推理框架。

AI 翻译 · 中文

IT之家IT之家 6 月 13 日消息，6 月 12 日，MiniMax 新一代原生多模态旗舰模型 M3 正式开源。同日，摩尔线程宣布旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。 IT之家从官方介绍获悉，针对 MiniMax M3 的核心技术特性，MTT S5000 从硬件算力、软件栈到开源框架进行了全链路精准匹配与深度优化：支撑超长上下文：高密度算力与大显存提供坚实支撑。 MSA 架构带来的超…

vLLM06-12 14:47原文
LMSYS Org (SGLang)06-12 14:18原文
Together AI06-13 02:53原文
lmarena.ai06-12 22:40原文
SiliconFlowAI06-11 16:26原文
Poe06-12 18:15原文
arXiv cs.LG06-11 15:27原文

阅读原文