美团发布LongCat-2.0,国产芯片上训练万亿参数模型

业界首个:美团 LongCat-2.0 发布,国产芯片上跑出的万亿参数模型

精选理由

美团开源了LongCat-2.0,国产芯片跑万亿参数,编程和Agent能力很强,还支持百万上下文,值得上手试试。

AI 摘要

美团今日发布LongCat-2.0,总参数1.6T,平均激活约48B,动态范围33B-56B,原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练,预训练数据规模超30T tokens。其在SWE-bench Pro中得分59.5,领先Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)和Claude Opus 4.6(57.3);在SWE-bench Multilingual中取得77.3,接近Claude Opus 4.6。推理阶段采用LongCat Sparse Attention和零计算专家机制,实现token级动态激活,降低解码延迟。

AI 翻译 · 中文

美团今日发布LongCat-2.0,总参数1.6T,平均激活约48B,动态范围33B-56B,原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练,预训练数据规模超30T tokens。其在SWE-bench Pro中得分59.5,领先Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)和Claude Opus 4.6(57.3);在SWE-bench Multilingual中取得77.3,接近Claude Opus 4.6。推理阶段采用LongCat Sparse Attention和零计算专家机制,实现token级动态激活,降低解码延迟。

IT之家IT之家 6 月 30 日消息,美团今日发布新一代万亿参数大模型 LongCat-2.0 ,并将对外开源。 LongCat-2.0 宣称是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数 1.6 T,平均激活约 48 B,动态范围 33B~56B), 从零开始预训练,原生支持 1M 超长上下文 。 正式版发布前,LongCat-2.0 预览版本已通过 OpenRouter 平台和 longcat.ai 面向全球开