英伟达(NVIDIA)于近期发布了其最新的开源大语言模型 Nemotron 3 Ultra,这是一款拥有 5500 亿参数的混合专家(MoE)架构模型,并采用状态空间模型(SSM)与 MoE 结合的设计。该模型专为长时间运行的智能体任务和编程场景优化,宣称推理速度较前代提升约 5 倍。
当前焦点在于:尽管 Nemotron 3 Ultra 在开源社区中树立了新标杆,但中美开源模型的性能差距依然存在;此外,其混合架构是否能持续在效果与效率间取得平衡,以及实际应用中的稳定性,值得进一步观察。
英伟达(NVIDIA)于近期发布了其最新的开源大语言模型 Nemotron 3 Ultra,这是一款拥有 5500 亿参数的混合专家(MoE)架构模型,并采用状态空间模型(SSM)与 MoE 结合的设计。该模型专为长时间运行的智能体任务和编程场景优化,宣称推理速度较前代提升约 5 倍。
当前焦点在于:尽管 Nemotron 3 Ultra 在开源社区中树立了新标杆,但中美开源模型的性能差距依然存在;此外,其混合架构是否能持续在效果与效率间取得平衡,以及实际应用中的稳定性,值得进一步观察。