05:48marktechpost@Asif Razzaq83°NVIDIA 发布了 Nemotron 3 Ultra,一个 550B 总参数(55B 激活)的开放混合专家模型,采用 Mamba-Transformer 混合架构。该模型支持 100 万 token 的上下文窗口,推理吞吐量比同等精度的开放 LLM 高约 6 倍。NVIDIA 同时开源了模型权重、训练数据和配方,遵循 OpenMDW-1.1 许可。这一发布旨在解决长时运行智能体在推理效率和上下文长度上的瓶颈,为 AI 代理和复杂任务自动化提供了更高效的基础模型。AI模型NVIDIANemotron 3 Ultra混合专家模型长上下文智能体10 个信源在谈推荐理由:长时智能体开发者终于有了一个兼顾超长上下文和高推理效率的开放模型——Nemotron 3 Ultra 的 6 倍吞吐量提升能显著降低部署成本,做 Agent 或 RAG 系统的团队值得直接试。原文
21:50Decoder@Maximilian Schreiner基准测试平台 Artificial Analysis 显示,Nvidia 的 Nemotron 3 Ultra 是目前美国最强大的开源 AI 模型,在多项指标上超越此前领先的 Llama 3 等模型。然而,该模型在整体性能上仍落后于中国开源模型如 DeepSeek 和 Qwen,表明中国在开源 AI 领域的领先地位依然稳固。这一进展凸显了美国在开源模型竞争中的追赶态势,但中国模型在推理、多模态等关键能力上仍保持优势。AI模型NvidiaNemotron 3 Ultra开源模型模型对比中国领先10 个信源在谈推荐理由:Nvidia 终于拿出了美国最强的开源模型,但中国开源模型依然领先,做模型选型和对比的开发者值得关注这一格局变化。原文
12:50IT之家(博客/媒体)精选78°英伟达发布 Nemotron 3 Ultra 开源模型,拥有 5500 亿参数,采用混合专家架构,专为全天候运行的自主智能体设计。该模型在推理速度上较同级别前沿模型最高提升 5 倍,使用成本降低 30%,并已适配 Hermes Agent、LangChain 等主流智能体平台。同时推出安全防护和语音识别模型,增强企业级智能体能力。CrowdStrike 和 Palantir 已将其用于网络安全和业务流程自动化。模型将于 6 月 4 日通过 Hugging Face 等平台以 NIM 微服务形式开放。AI模型英伟达Nemotron 3 Ultra开源模型智能体混合专家模型5 个信源在谈推荐理由:英伟达把大模型推理速度和成本同时优化了,做智能体开发或企业自动化的团队可以直接用上,比现有开源方案更高效省钱,值得关注。原文