Nemotron 3 Ultra

§ 01综述

Nemotron 3 Ultra 是 NVIDIA 最新发布的开源大语言模型，拥有 5500 亿参数并采用 Mamba-2 混合架构，在推理效率上实现显著突破。该模型专为 Agent 任务设计，性能可媲美 GPT-5.5，但运行成本仅为其十分之一。当前，Nemotron 3 Ultra 已登陆多个平台，并展示了在基准测试和实际应用中的竞争力。

Nemotron 3 Ultra 近期进展

NVIDIA 发布自托管指南：四台 DGX Spark 即可运行 Nemotron 3 Ultra 550B，降低了部署门槛。原文标题

基准测试与排行榜表现：Nemotron 3 Ultra 在 AA-Briefcase 基准测试中表现优异，并登上 Agent Arena 排行榜第20名，显示其 Agent 能力。原文标题原文标题

平台扩展与应用：Fireworks 训练平台扩展支持 Nemotron 3 Ultra 后训练，Perplexity 也向 Pro/Max 用户开放该模型，生态快速扩大。原文标题原文标题

当前焦点与观察点

Nemotron 3 Ultra 的焦点在于其高效的混合架构和开源策略。相比同尺寸闭源模型，它以极低推理成本实现了接近顶尖水平的表现，尤其在 Agent 任务上具有优势。争议点主要围绕其真实性能——虽然部分评测显示逼近 GPT-5.5，但独立榜单排名并非最高，且实际应用场景仍需验证。此外，开源许可和生态支持也是社区关注的热点，NVIDIA 正通过自托管和第三方平台加速其落地。

§ 02相关报道10 条在档

§ 03邻近话题