13:23shao__meng@shao__meng77°美团发布LongCat-2.0,采用1.6T参数MoE架构,激活参数48B,上下文窗口1M(最大输出128K),使用5-6万张国产加速卡训练,全过程不依赖英伟达。模型在Terminal-Bench 2.1上得70.8,SWE-bench Pro 59.5(超过GPT-5.5的58.6)。其稀疏注意力与跨层索引技术支撑长上下文,并自研底层算子弥补国产芯片短板。LongCat-2.0定位Agent与编程任务,已在OpenRouter上提供预览。AI模型LongCat-2.0MeituanMoE国产加速卡编程助手1 个信源在谈推荐理由:美团搞了个纯国产卡训练的1.6T MoE模型,激活参数48B,1M上下文,编程和Agent场景表现强,在SWE-bench Pro上还超过了GPT-5.5,值得编程开发者试试。原文
11:00IT之家(博客/媒体)73°美团今日发布LongCat-2.0,总参数1.6T,平均激活约48B,动态范围33B-56B,原生支持1M超长上下文。该模型在五万卡国产算力集群上完成全流程训练,预训练数据规模超30T tokens。其在SWE-bench Pro中得分59.5,领先Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)和Claude Opus 4.6(57.3);在SWE-bench Multilingual中取得77.3,接近Claude Opus 4.6。推理阶段采用LongCat Sparse Attention和零计算专家机制,实现token级动态激活,降低解码延迟。AI模型LongCat-2.0美团MoE推理模型编程助手1 个信源在谈推荐理由:美团开源了LongCat-2.0,国产芯片跑万亿参数,编程和Agent能力很强,还支持百万上下文,值得上手试试。原文