nemotron3ultra·product

Nemotron 3 Ultra

别名
首次出现
2026-06-01
最近出现
2026-06-12
累计提及
47
§ 01综述

英伟达(NVIDIA)于近期发布了其最新的开源大语言模型 Nemotron 3 Ultra,这是一款拥有 5500 亿参数的混合专家(MoE)架构模型,并采用状态空间模型(SSM)与 MoE 结合的设计。该模型专为长时间运行的智能体任务和编程场景优化,宣称推理速度较前代提升约 5 倍。

  • 英伟达官方宣布 Nemotron 3 Ultra 完全开源,不仅开放模型权重,还公开了训练数据和配方(NVIDIA AI)。
  • 该模型在多项基准测试中表现强劲,有报道称其成为美国目前最强的开源模型,但整体性能仍不及中国的一些领先模型(Decoder)。
  • 针对智能体与编程的优化使其在长上下文和代码生成任务上具有优势,同时推理效率的大幅提升降低了部署成本(Paul Couvert)。
  • 当前焦点在于:尽管 Nemotron 3 Ultra 在开源社区中树立了新标杆,但中美开源模型的性能差距依然存在;此外,其混合架构是否能持续在效果与效率间取得平衡,以及实际应用中的稳定性,值得进一步观察。

    § 02相关报道10 条在档
    1. 01
      Nemotron 3 Ultra 开源:Mamba-2 混合架构,效率惊人
      Sebastian Raschka
    2. 02
      Hermes Agent + Nemotron 3 Ultra 组合强大,DAIR.AI 推新学习平台
      elvis
    3. 03
      NVIDIA 发布 Nemotron 3 Ultra:550B 参数开源 Agent 模型
      AI Will
    4. 04
      Fireworks 训练平台扩展,支持 Nemotron 3 Ultra 后训练
      Fireworks AI
    5. 05
      NVIDIA 发布 Nemotron 3 Ultra 模型,附教程与演示
      NVIDIA AI
    6. 06
      Nemotron 3 Ultra 登陆 Perplexity,Pro/Max 用户可用
      Aravind Srinivas
    7. 07
      Perplexity 上线 Nemotron 3 Ultra,面向 Pro/Max 用户
      Perplexity
    8. 08
      NVIDIA Nemotron 3 Ultra:开源模型性能逼近闭源,成本低10倍
      Paul Couvert
    9. 09
      Nemotron 3 Ultra vs GPT-5.5:10倍成本差,效果接近
      rohanpaul_ai
    10. 10
      NVIDIA 发布 Nemotron 3 Ultra:550B MoE 开源模型,专为长时智能体设计
      lmarena.ai
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Nemotron%203%20Ultra