nemotron·general

Nemotron

别名
首次出现
2026-05-22
最近出现
2026-06-13
累计提及
123
§ 01综述

NVIDIA 的开源大模型系列 Nemotron 近期迎来重大更新,其中 Nemotron 3 Ultra 凭借 5500 亿参数和混合 SSM+MoE 架构,在多项基准中成为美国最强的开源模型,但整体仍落后于中国顶尖模型。同时,NVIDIA 通过 Hugging Face 突破 1000 个公开仓库,巩固了其开源 AI 领导地位。

  • Nemotron 3 Ultra 发布与性能:NVIDIA 在 COMPUTEX 上发布 Nemotron 3 Ultra,采用 SSM+MoE 混合架构,推理速度较前代提升 5 倍 (IT之家)。该模型在多个评测中成为美国最强开源模型,但 Decoder 指出中国模型仍保持领先 (Decoder)。
  • 开源生态扩展:NVIDIA 在 Hugging Face 上的公开仓库数突破 1000 个,并推出新模型与框架,进一步强化开源影响力 (Hugging Face, Clement Delangue)。
  • 其他模型与创新:Nemotron 3 Super 经后训练后,在复杂法律任务上可媲美闭源前沿模型 (NVIDIA AI);Nemotron Labs 还发布了文本扩散与弹性推理技术 (NVIDIA AI)。
  • 当前焦点在于 Nemotron 3 Ultra 能否在与中美顶尖模型的竞争中占据上风,以及 NVIDIA 如何通过开源策略(如加入 Linux 基金会 OpenMDW 框架统一许可)推动生态发展。未来值得观察的是 Nemotron 系列在专业领域(如法律、推理)的持续优化,以及能否缩小与中国模型的差距。

    § 02相关报道10 条在档
    1. 01
      NVIDIA Nemotron 3 Ultra 登上 Agent Arena 排行榜第20名
      lmarena.ai
    2. 02
      Nemotron 3 Ultra 开源:Mamba-2 混合架构,效率惊人
      Sebastian Raschka
    3. 03
      AI训练数据不再只靠人类:ModSleuth揭示模型依赖链
      Allen AI (Ai2)
    4. 04
      LMSYS 发布 TITO 技术:确保 RL 训练中每个 token 都在策略上
      LMSYS Org (SGLang)
    5. 05
      NVIDIA Nemotron 3 深度解析:混合 Mamba Transformer + 潜在 MoE + MTP
      NVIDIA AI
    6. 06
      用 Streaming、Pandas 和 tiktoken 构建 NVIDIA Nemotron 代码数据集管道
      marktechpost
    7. 07
      Hermes Agent + Nemotron 3 Ultra 组合强大,DAIR.AI 推新学习平台
      elvis
    8. 08
      30 Days of Hermes Agents 课程获赞,结合 Nemotron 3 Ultra 模型
      elvis
    9. 09
      Cadence 携手 NVIDIA 发布全自主芯片设计 AI 虚拟工程师
      IT之家
    10. 10
      DeepAgent 竞品分析工具发布,产品经理新利器
      Harrison Chase
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Nemotron