全部 AI 动态 · AI 热点

6月16日

14:23

AlphaSignal@AlphaSignalAI

精选

NVIDIA开源了AI技能安全扫描器SkillSpector。研究发现26.1%的已发布AI技能存在漏洞，36%包含提示注入向量。SkillSpector无需扫描恶意代码即可检测危险特性，帮助开发者避免在安装未扫描技能时的常见风险。该工具专为检查AI技能潜在安全问题设计，可集成到开发流程中。

AI产品 NVIDIA SkillSpector AI安全提示注入开源工具

推荐理由：NVIDIA开源了SkillSpector，专门扫描AI技能的漏洞和提示注入。别像99%的开发者那样不检查就直接装，先扫一下再安心用。

原文

6月13日

19:30

pandaily@contact@pandaily.com (Pandaily)

NVIDIA拉丁美洲负责人否认Anthropic关于该地区成为受限AI芯片流入中国渠道的指控。该负责人同时表达了对美国出口管制政策的不满。Anthropic此前指控称，部分受限芯片通过拉丁美洲转运至中国。NVIDIA强调其遵守所有出口法规，并否认存在违规行为。

行业 NVIDIA Anthropic 芯片出口管制拉丁美洲 AI芯片

推荐理由：NVIDIA正面回应芯片走私指控

原文

13:12

MiniMax_AI@MiniMax_AI

MiniMax 宣布其 M3 模型端点获得 NVIDIA 官方认可，并已上线免费 GPU 加速版本。用户现在可以免费体验基于 NVIDIA GPU 加速的 M3 模型推理服务。该端点支持高性能计算，适用于多种 AI 任务。

AI产品 MiniMax M3 NVIDIA GPU加速

推荐理由：MiniMax 的 M3 模型免费加速了

原文

11:20

AI Will@FinanceYF5

Lilly、Novartis和J&J与Isomorphic Labs达成合作，投入数十亿美元用于AI设计的药物。Lilly还与NVIDIA启动了一项AI药物发现计划。Synaptic Data梳理了AI药物发现技术栈8层上的110+家初创公司。

行业 Isomorphic Labs Lilly Novartis J&J NVIDIA AI药物发现

推荐理由：三大药企联手AI公司砸钱

原文

11:05

lmarena.ai@lmarena_ai

精选

NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名，在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出，但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽，排名仍在稳定中。

AI模型 Nemotron 3 Ultra NVIDIA Agent Arena 开源模型智能体

推荐理由：NVIDIA 开源模型在智能体评测中排第5

原文

09:55

rohanpaul_ai@rohanpaul_ai

精选73°

NVIDIA 发布了首个智能体 AI 基准测试 AgentPerf 的结果。该基准由 Artificial Analysis 推出，测试系统在保持响应性的同时能并发运行多少个智能体。GB300 NVL72 在最低服务层级达到每兆瓦 61.4K 并发智能体，而 H200 仅为 2.6K，性能提升约 23.6 倍。测试模拟了真实编码智能体路径，涵盖 12 种以上编程语言，请求长度从 5K 到 131K token 不等，平均约 27K token。性能提升得益于 72 块 GPU 通过 NVLink 组成机架级系统，以及优化 MoE 专家分配、通信与计算重叠等软件技术。

AI模型 NVIDIA GB300 NVL72 H200 AgentPerf 智能体

推荐理由：NVIDIA 首个智能体基准，GB300 比 H200 强 23 倍

原文

6月12日

13:34

Thinking Machines Lab@thinkymachines

83°

Think Machines 宣布与 NVIDIA 合作，利用其硬件和平台来训练前沿模型，并提供可定制的 AI 解决方案。这一合作将加速模型训练效率，降低开发门槛，使企业能够更灵活地部署定制化 AI。NVIDIA 的算力支持将帮助 Think Machines 在竞争激烈的 AI 市场中提升模型性能。

行业 NVIDIA Think Machines 模型训练 AI 定制合作

推荐理由：NVIDIA 与 Think Machines 的合作意味着更强大的算力支持，做模型训练和定制 AI 的团队可以关注这一进展，看看能否利用其平台加速自己的项目。

原文

12:50

Artificial Analysis@ArtificialAnlys

精选

随着用户和企业赋予 AI 模型和智能体更多自主权，筛选其输入输出的护栏变得至关重要。然而，现有的护栏评测基准未能跟上模型智能的发展速度。与 NVIDIA 合作，该团队在三个开放数据集上独立评测了护栏与审核模型，衡量了检测质量、延迟以及捕捉不安全内容与过度拒绝安全内容之间的权衡。结果显示，没有模型能全面胜出，且缺乏统一的评判标准。这被视为一个测量问题的早期步骤，随着模型承担更多实际工作，该问题将愈发重要。

行业 AI 安全护栏评测 NVIDIA 模型审核智能体

推荐理由：AI 安全护栏评测标准滞后，做模型部署和安全审核的团队需要关注这个评测缺口，建议点开了解当前护栏模型的真实表现。

原文

12:42

Sebastian Raschka@rasbt

精选

Nemotron 3 Ultra 是 NVIDIA 发布的新一代开源权重模型，延续了前代 Super 变体的 Mamba-2 注意力混合架构和 LatentMoE 设计，但规模更大。该模型在能力与效率之间取得了极佳平衡，性能表现令人印象深刻。开源权重意味着开发者可以自由下载、微调和部署，适合资源受限但追求高性能的场景。这一发布进一步丰富了开源大模型生态，为研究者和工程师提供了新的选择。

AI模型 Nemotron 3 Ultra Mamba-2 LatentMoE 开源/仓库 NVIDIA

推荐理由：NVIDIA 把 Mamba-2 混合架构和 LatentMoE 做到更大更强，追求高性价比模型的团队可以直接拿来用，省去从头训练的昂贵成本。

原文

12:31

karminski-牙医 (AI工具)@karminski3

精选

Google发布了Gemma小模型的Diffusion版本，名为Diffusion Gemma，大小26B但激活参数量仅4B。与NVIDIA合作针对RTX 4090和5090优化，5090上每秒可生成700+ token。Diffusion模型像刮奖一样逐片生成文本，速度远快于传统逐字生成模型，但输出质量略低。在AIME 2026数学测试中达到Gemma4-26B-A4B的94%水平，在Agent能力测试中达到82%。4bit量化版本仅需16G显存即可运行。

AI模型 Diffusion模型 Gemma Google NVIDIA 推理加速

推荐理由：Diffusion Gemma把文本生成速度拉到单卡700TPS，做实时对话或高吞吐推理的团队可以直接用，4bit量化16G显存就能跑，值得试试能否做投机解码的草稿模型。

原文

12:29

Mira Murati (TML)@miramurati

前 OpenAI CTO Mira Murati 在 X 上发文感谢 NVIDIA CEO Jensen Huang 及其团队的支持，宣布双方合作部署至少 1GW 的 Vera Rubin 系统。该系统旨在将可适应的协作 AI 带给每个人，标志着 AI 基础设施的大规模扩展。Vera Rubin 是 NVIDIA 下一代 AI 计算平台，此次合作将显著提升 AI 训练和推理能力。

行业 NVIDIA Vera Rubin AI 基础设施合作 Mira Murati

推荐理由：AI 基础设施的规模化部署是行业关键瓶颈，关注算力布局的团队和开发者值得了解这一合作动向。

原文

07:02

NVIDIA AI@NVIDIAAI

NVIDIA 宣布将参加 2026 年在洛杉矶举办的 SIGGRAPH 大会，展示神经渲染、世界模型、物理 AI 等前沿技术，并提供动手实验室。SIGGRAPH 是计算机图形学与交互技术领域的顶级会议，NVIDIA 的参与意味着其最新图形与 AI 研究成果将集中亮相。对于图形开发者、AI 研究者和游戏行业从业者来说，这是了解下一代渲染与仿真技术的重要窗口。

行业 NVIDIA SIGGRAPH 2026 神经渲染物理 AI 世界模型

推荐理由：NVIDIA 把 SIGGRAPH 当作技术风向标，做图形渲染、物理仿真或 AI 模型的团队值得关注，可以提前规划参会或跟进后续发布。

原文

06:16

NVIDIA AI@NVIDIAAI

精选

NVIDIA Research发布开放模型MotionBricks，基于35万+运动片段实现每秒15,000帧的实时角色动画。该模型无需手工制作过渡或微调，可直接用于角色动画，并支持机器人应用。相关论文将发表于SIGGRAPH 2026，代码和演示已开源。

AI模型 MotionBricks NVIDIA 角色动画实时机器人

推荐理由：NVIDIA开源实时动画，35万片段15K FPS

原文

04:41

NVIDIA AI@NVIDIAAI

NVIDIA 发布 Nemotron 3 模型，采用混合 Mamba Transformer 架构，通过 Mamba-2 降低注意力机制开销，实现亚二次复杂度。潜在 MoE 通过降维投影减少 HBM 与 SRAM 间的数据移动，并增加专家数量以提升稀疏性效率。多 token 预测（MTP）使模型在训练时能预见未来 token，推理时可用于推测解码。模型采用新的 OpenMDW 1.1 许可证。

AI模型 Nemotron 3 混合 Mamba Transformer 潜在 MoE 多 token 预测 NVIDIA

推荐理由：Nemotron 3 的架构创新直击大模型推理效率瓶颈，做模型优化和部署的开发者值得关注其混合 Mamba 和潜在 MoE 的具体实现，可以直接参考其设计思路。

原文

04:04

Together AI@togethercompute

精选

Trajectory Labs 在 Together Compute 和 NVIDIA 的支持下，仅用不到 24 小时就在一个开放模型上实现了前沿模型级别的性能。这展示了当优秀开源模型与合适的训练基础设施结合时，可以快速取得显著成果。Together Compute 为此提供了算力支持，凸显了开放模型生态的潜力。

AI模型开放模型后训练算力基础设施 Together Compute NVIDIA

推荐理由：对于关注开源模型训练效率的团队，这个案例证明了 24 小时内就能让开放模型达到前沿水平，值得研究其训练流程。

原文

03:08

NVIDIA AI@NVIDIAAI

NVIDIA 推出了 Brev Launchables 和 Agent Skills，用于生成物理 AI 的合成数据。这些工具旨在解决物理 AI 训练数据稀缺的问题，通过自动化生成高质量合成数据，加速机器人、自动驾驶等物理 AI 应用的开发。Brev Launchables 提供可复用的数据生成环境，Agent Skills 则赋予智能体自主执行数据采集任务的能力。这对从事物理 AI 研究的团队来说是一个重要的基础设施更新。

AI产品 NVIDIA 物理AI 合成数据 Brev Launchables Agent Skills

推荐理由：物理 AI 训练数据难获取是行业痛点，NVIDIA 这套工具直接降低了合成数据门槛，做机器人或自动驾驶的开发者值得关注，可以大幅减少手动标注成本。

原文

00:35

NVIDIA AI@NVIDIAAI

精选

NVIDIA 发布了 Cosmos 3，这是一个专为机器人和物理 AI 设计的基础模型平台。该平台旨在加速机器人感知、规划和交互能力的开发，通过提供预训练模型和工具链，降低物理 AI 应用的门槛。Cosmos 3 支持多模态输入，能够生成高保真的物理世界模拟，帮助开发者更快地训练和部署机器人系统。这一发布标志着 NVIDIA 在物理 AI 领域的重要布局，有望推动机器人技术从实验室走向实际应用。

AI产品机器人物理AI NVIDIA 基础模型仿真

推荐理由：NVIDIA Cosmos 3 为机器人开发者提供了现成的物理 AI 基础模型，省去了从零训练的时间和成本，做机器人感知或仿真的团队可以直接上手试试。

原文

6月11日

10:40

Ate-a-Pi@svpino

NVIDIA 与微软合作推出两款新设备：DGX Station 搭载 GB300 超级芯片，最高 748GB 内存；RTX Spark 笔记本拥有 1 petaflop AI 性能和 128GB 统一内存。这些硬件配置极为强大，面向 AI 开发者和研究人员。DGX Station 适合本地训练大型模型，而 RTX Spark 则提供便携的高性能 AI 计算能力。此举将推动边缘 AI 和本地部署的普及。

AI产品 NVIDIA 微软 DGX Station RTX Spark AI 硬件

推荐理由：AI 开发者和研究人员终于有了本地高性能计算的新选择——DGX Station 适合模型训练，RTX Spark 适合便携推理，建议关注具体规格和价格。

原文

04:44

04:44Simon Willison’s Weblog（博客/媒体）

76°

Google 去年曾短暂发布实验性的 Gemini Diffusion 模型，如今以开源形式回归，推出 DiffusionGemma-26B-A4B-it 模型，采用 Apache 2 许可证。该模型在 NVIDIA NIM 云 API 上免费托管，生成速度可达 500+ tokens/秒。作者实测生成 2409 tokens 仅需 4.4 秒，性能出色。这是 Google 在扩散模型领域的重要开源动作，为开发者提供了高性能的生成式 AI 选项。

AI模型 Google DiffusionGemma 开源/仓库 NVIDIA 生成式AI

推荐理由：Google 把去年惊艳的扩散模型开源了，做图像/文本生成的开发者可以直接用 NVIDIA 免费 API 体验，速度超 500 tokens/秒，值得立刻上手试。

原文

03:06

NVIDIA AI@NVIDIAAI

76°

Google DeepMind 推出实验性开源模型 DiffusionGemma，采用文本扩散技术，每步并行生成 256 个 token，推理速度可达 150+ TPS（DGX Spark）或 1000+ TPS（单张 H100）。该模型激活仅 3.8B 参数，量化后可在 24GB VRAM 消费级 GPU 上运行，适合代码填充、内联编辑等非线性任务。NVIDIA 从首日起提供 BF16/NVFP4 检查点、免费 GPU 加速端点及 vLLM 支持。DiffusionGemma 优先速度而非极致质量，生产场景仍推荐标准 Gemma 4。

AI模型文本扩散并行生成开源模型 Google DeepMind NVIDIA

推荐理由：文本扩散模型把生成速度拉到新高度，做代码补全或实时编辑的开发者可以直接在 NVIDIA 端点试跑，感受并行 token 的爽感。

原文

6月10日

12:55

marktechpost@Sana Hassan

精选

本文教程展示了如何从 NVIDIA 的 Nemotron-Pretraining-Code-v3 数据集中构建代码数据集管道。通过流式处理而非下载整个数据集，检查其模式并构建可管理的样本。分析了语言、文件扩展名、仓库频率和目录深度等元数据索引结构。然后重构原始 GitHub URL，获取真实源文件，并使用 tiktoken 估算获取代码的 token 规模。该方法适用于大规模代码预训练研究的数据处理。

论文 NVIDIA Nemotron-Pretraining-Code-v3 代码数据集流式处理 tiktoken

推荐理由：做代码预训练或大规模数据处理的研究人员可以直接复用这套管道，省去下载和解析海量元数据的麻烦，值得一试。

原文

6月9日

20:38

PolymarketMoney@PolymarketMoney

NVIDIA（$NVDA）与 NBIS（$NBIS）联合启动了 Physical AI Living Lab，这是一个专为机器人初创公司设计的实体 AI 实验室。该实验室旨在为初创企业提供物理环境、计算资源和数据支持，加速机器人技术的研发与落地。此举标志着 AI 从虚拟世界向物理世界的延伸，对机器人行业具有重要推动作用。初创公司可借此降低开发门槛，更快实现产品原型测试。

AI产品机器人 Physical AI NVIDIA NBIS 初创公司

推荐理由：机器人初创公司终于有了实体 AI 试验场——NVIDIA 和 NBIS 的 Living Lab 解决了从仿真到现实部署的痛点，做机器人开发的团队值得关注，可以直接申请使用。

原文

10:31

10:31IT之家（博客/媒体）

78°

Cadence 在 COMPUTEX 2026 上宣布，其 ChipStack AI Super Agent 在 NVIDIA 支持下达到 Level-5 自主水平，成为业界首款全自主芯片设计 AI 虚拟工程师。该智能体基于 Cadence AI 驱动 EDA 产品组合和 NVIDIA Nemotron 模型构建，由 NVIDIA OpenShell 沙箱提供安全保障。它能独立执行复杂的芯片设计和验证工作流程，无需逐步提示，可评估中间结果并自主决策，覆盖规格理解、RTL 生成、验证规划等任务。这标志着芯片设计从 AI 辅助工程师向自主虚拟工程师的跨越，将显著提升资深工程师的设计效率和信心。

AI产品芯片设计自主智能体 Cadence NVIDIA EDA

推荐理由：芯片设计团队终于有了能独立干活的 AI 虚拟工程师——ChipStack 从辅助进化为自主执行，做复杂芯片验证的工程师可以直接用它加速迭代，值得点开了解。

原文

08:05

NVIDIA AI@NVIDIAAI

精选72°

NVIDIA 在 Blackwell 平台上使用 NVFP4 精度训练了 Llama 3 8B 和 405B 模型。实验结果显示，相比 FP8 精度，NVFP4 实现了 1.31 到 1.73 倍的训练速度提升，且未出现任何精度损失。这一突破意味着大模型训练可以在更短的时间内完成，同时保持模型质量。对于需要大规模训练 AI 模型的团队来说，这能显著降低计算成本和等待时间。

AI模型 NVIDIA Blackwell NVFP4 Llama 3 训练加速

推荐理由：训练速度提升 1.3-1.7 倍且零精度损失，做大规模模型训练的团队可以直接在 Blackwell 上尝试 NVFP4，省时省成本。

原文

6月8日

13:36

AI Will@FinanceYF5

SK hynix与NVIDIA签署了多年合作协议，旨在提前联合设计先进DRAM，避免等待GPU设计完成后再开始内存芯片制造。合作覆盖AI超算、个人AI PC和Jetson机器人平台。SK hynix还将利用NVIDIA工具构建芯片厂数字孪生，在真实产线运行前完成虚拟测试。这表明AI基础设施的军备竞赛已深入内存层，长期联合规划成为关键。

行业 SK hynix NVIDIA AI基础设施 DRAM 数字孪生

推荐理由：AI基础设施的竞争已从GPU延伸到内存，做AI硬件或数据中心规划的团队需要关注——内存的联合设计周期直接影响GPU迭代节奏，提前布局才能不掉队。

原文

09:06

09:06IT之家（博客/媒体）

韩国SK电讯宣布将基于NVIDIA的AI工厂平台DSX建设AI数据中心，目标将AI云服务规模扩展至GW级别。初期采用Blackwell架构GPU，后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运，并计划扩展至整个亚洲，成为亚洲领先的AI云提供商。此外，双方还在机器人仿真和训练平台方面展开合作。

行业 AI云数据中心 NVIDIA SK电讯基础设施

推荐理由：SK电讯的GW级AI云计划标志着电信运营商正式切入AI基础设施赛道，对关注亚洲AI云市场、数据中心建设的从业者来说，这是一个值得跟踪的行业信号。

原文

09:00

rohanpaul_ai@rohanpaul_ai

精选76°

SK hynix 与 NVIDIA 宣布建立多年存储合作伙伴关系，共同开发用于下一代 AI 工厂的芯片。合作涵盖 NVIDIA Vera Rubin AI 超级计算机、Vera CPU、RTX Spark 驱动的 PC 和 Jetson Thor 平台的内存。SK hynix 将利用 NVIDIA 的 CUDA-X、PhysicsNeMo、Omniverse 等工具加速芯片设计、半导体仿真和工厂数字孪生。这一合作标志着存储芯片设计不再滞后于 GPU，而是需要提前数年进行协同设计和制造规划。同时，AI 技术也被引入芯片制造本身，用于加速半导体物理、光刻等工程流程。

行业 NVIDIA SK hynix AI 硬件存储芯片数字孪生

推荐理由：AI 硬件供应链正在重构，存储与计算芯片的协同设计成为关键。做 AI 基础设施、芯片设计或半导体制造的团队，值得关注这一合作如何改变未来 AI 工厂的构建方式。

原文

6月7日

08:25

AI Will@FinanceYF5

88°

NVIDIA 近日发布 Nemotron 3 Ultra，这是一款专为长期运行的 AI Agent 设计的旗舰开源模型。该模型采用 550B 参数的 MoE 架构，激活参数仅 55B，推理速度比同级开源模型快 5 倍，Agent 任务成本降低 30%。Nemotron 3 Ultra 旨在解决复杂、长时间运行的 Agent 任务中的效率与成本问题，为开发者提供高性能且经济的选择。该模型的开源特性有望推动 Agent 应用生态的发展。

AI模型 NVIDIA Nemotron 3 Ultra 开源模型 Agent MoE

推荐理由：做 Agent 开发的团队终于有了一个高性能且成本可控的开源选择——Nemotron 3 Ultra 推理快 5 倍、成本降 30%，值得直接上手试试。

原文

6月6日

15:55

marktechpost@Asif Razzaq

精选

NVIDIA发布了Nemotron 3.5 ASR，一个600M参数的流式语音识别模型。该模型采用cache-aware架构，可从单个检查点实时转录40种语言-区域。它针对低延迟场景优化，支持多种语言的实时语音转文字。

AI模型 Nemotron 3.5 ASR NVIDIA 语音识别流式模型多语言

推荐理由：600M模型转40语言实时

原文

15:44

Aadit Sheth@aaditsh

72°

据一份新文件显示，SpaceX 与 Google 达成协议，从 2026 年 10 月起每月向 Google 提供约 11 万块 NVIDIA GPU 的计算能力，月费高达 9.2 亿美元，合同总额约 300 亿美元。Google 自身拥有 TPU 和庞大云基础设施，却向一家火箭公司租用 GPU，引发行业震动。这可能意味着 Google 的 AI 算力需求已超出自身建设速度，或 SpaceX 在 AI 基础设施方面有未公开的突破。合同允许任何一方在 2026 年 12 月后提前 90 天终止，Google 保留其 AI 模型和数据的知识产权。

行业 GPU 算力租赁 Google SpaceX NVIDIA

推荐理由：这则消息揭示了 AI 算力需求已大到连 Google 都要向火箭公司租 GPU，做 AI 基础设施或关注算力瓶颈的从业者值得点开，看看背后到底发生了什么。

原文

13:20

Perplexity@perplexity_ai

72°

Perplexity 宣布其 Pro 和 Max 订阅用户现在可以使用 Nemotron 3 Ultra 模型。该模型由 NVIDIA 开发，是一款专为长时间运行的智能体任务设计的新开源模型。此举将高性能的智能体能力直接提供给付费用户，无需额外配置。对于依赖 AI 进行复杂、持续任务的用户来说，这是一个直接可用的新选择。

AI产品 Perplexity Nemotron 3 Ultra NVIDIA 智能体开源模型

推荐理由：做长任务智能体的开发者可以直接在 Perplexity 上体验 NVIDIA 的最新开源模型，省去部署成本，值得 Pro/Max 用户试试。

原文

08:18

NVIDIA AI@NVIDIAAI

NVIDIA 正式推出 Nemotron 3 Ultra 模型，并同步发布了详细的设置教程，指导用户如何在智能体框架中集成该模型。官方还展示了多个能力演示视频，涵盖推理、编程等场景。该模型旨在提升 AI 智能体的性能，为开发者提供更强大的基础模型选择。教程和演示资源已公开，方便开发者快速上手。

AI模型 NVIDIA Nemotron 3 Ultra 智能体教程推理模型

推荐理由：NVIDIA 为智能体开发者提供了开箱即用的教程和演示，做 AI 应用集成的团队可以直接参考，省去自己摸索的时间。

原文

08:03

Aravind Srinivas@AravSrinivas

AI产品 Nemotron 3 Ultra NVIDIA Perplexity 开源模型智能体

推荐理由：NVIDIA 的 Nemotron 3 Ultra 是专为长时智能体任务设计的开源模型，做 AI 智能体开发的团队可以直接在 Perplexity 上试用，省去本地部署的麻烦。

原文

07:51

NVIDIA AI@NVIDIAAI

72°

NVIDIA Research 的 PixelDiT（像素扩散 Transformer）入选 CVPR2026 最佳论文候选。传统图像生成模型依赖预训练自编码器压缩图像后再进行扩散，导致质量损失累积。PixelDiT 完全移除这一步骤，直接在像素空间进行端到端扩散学习，是一种单阶段模型。该方法避免了压缩带来的信息丢失，有望提升生成图像的保真度和细节表现。这一创新为图像生成领域提供了新的技术路径。

论文图像生成扩散模型 PixelDiT NVIDIA CVPR

推荐理由：NVIDIA 的 PixelDiT 解决了传统扩散模型因预训练编码器压缩导致的质量损失问题，做图像生成的研究者和开发者值得关注——它可能改变现有生成流程的底层设计。

原文

03:28

Jim Fan@jimfan

NVIDIA 研究团队在 CVPR 2026 上展示了三篇关于物理 AI 的论文，分别针对零样本抓取、高效推理和具身智能体训练。GraspGen-X 是首个零样本抓取基础模型，基于数十亿次模拟抓取训练；LCDrive 用紧凑的潜在表示替代昂贵的文本推理；NitroGen 则是一个通用游戏 AI 基础模型，利用 NVIDIA Isaac GR00T 训练具身智能体。这些工作为大规模训练提供了突破性方案，覆盖了机器人操作、自动驾驶和游戏 AI 等关键领域。

论文物理 AI 零样本抓取具身智能体 NVIDIA CVPR

推荐理由：做机器人抓取、自动驾驶或游戏 AI 的开发者，这三篇论文直接给出了可规模化训练的新思路——零样本抓取和紧凑推理方案值得重点关注。

原文

02:36

NVIDIA AI@NVIDIAAI

NVIDIA 宣布其 Nemotron Coalition 新增三家成员：@hcompany_ai、@NousResearch 和 @PrimeIntellect。该联盟旨在协作开发前沿开放模型，现有成员包括 Black Forest Labs、Cursor、LangChain、Mistral AI 等。Nemotron 3 Ultra 模型已在联盟成员贡献下完成开发，未来将继续合作推进新模型发布。Prime Intellect 表示将贡献其强化学习基础设施，帮助扩展智能体能力。

行业 NVIDIA Nemotron 开放模型联盟智能体

推荐理由：开放模型生态再添生力军，做 AI 模型训练或智能体开发的团队值得关注——联盟协作模式可能加速下一代开源模型落地。

原文

6月5日

22:18

Paul Couvert@itsPaulAi

72°

NVIDIA 发布了开源模型 Nemotron 3 Ultra，专为智能体任务和编程设计。该模型在性能上接近闭源模型 GPT 5.5，但推理成本仅为后者的十分之一（$0.051 vs $0.57）。Nemotron 3 Ultra 速度比同类模型快5倍，成本低30%，已在 Hugging Face 上开源。这标志着开源模型与闭源模型之间的质量差距正在迅速缩小，尤其适合处理大型代码库和智能体应用。

AI模型 NVIDIA Nemotron 3 Ultra 开源模型推理模型编程助手

推荐理由：开源模型性能逼近闭源，成本却低一个数量级——做智能体或编程的开发者可以直接在 Hugging Face 上试用，省下不少推理预算。

原文

19:18

marktechpost@Asif Razzaq

NVIDIA 推出了 Dynamo Snapshot，这是一个基于 CRIU 和 cuda-checkpoint 工具的系统，用于在 Kubernetes 上对 vLLM 推理工作节点进行快照和恢复。该系统能够显著加速 AI 推理服务的启动时间，解决冷启动延迟问题。通过保存和恢复推理工作节点的状态，Dynamo Snapshot 使得在 Kubernetes 集群中快速扩缩容成为可能，尤其适用于需要频繁调整推理资源的场景。这一工具对于部署大规模 AI 推理服务的团队来说，可以提升资源利用率和响应速度。

AI产品 NVIDIA Dynamo Snapshot Kubernetes AI推理 CRIU

推荐理由：NVIDIA 用 CRIU 快照解决了 Kubernetes 上 AI 推理的冷启动痛点，做模型推理部署的团队可以直接用这个工具来加速扩缩容，值得关注。

原文

08:13

lmarena.ai@lmarena_ai

精选76°

Arena.ai 宣布将 NVIDIA 的 Nemotron 3 Ultra 模型加入其新的 Agent Mode，用于评估 AI 智能体在真实世界中的多步骤任务能力。Agent Arena 通过数百万次真实用户会话，测量模型在编写代码、创建演示文稿、网络研究、构建应用和文档分析等复杂工作流中的表现。评估基于任务成功率、可操控性、错误恢复、用户反馈和工具幻觉五个信号。当前排行榜显示 OpenAI GPT-5.5 排名第一，Anthropic Claude-Opus-4.7 第二，Zai GLM-5.1 第三。该平台已积累超过 30 万任务、200 万次工具调用和 4000 万行代码数据。

AI产品智能体评估/基准 NVIDIA Nemotron 3 Ultra Agent Arena

推荐理由：Agent Arena 用真实任务数据解决了智能体评估难的问题，做 AI 智能体开发或选型的团队可以直接参考排行榜和会话信号，比纯基准测试更有说服力。

原文

08:12

lmarena.ai@lmarena_ai

精选83°

NVIDIA 今日正式发布 Nemotron 3 Ultra，这是一款 550B 参数的混合专家（MoE）开源模型，定位为前沿智能（frontier-intelligence）模型，专为长时间运行的智能体任务打造。相比其他开源前沿模型，Nemotron 3 Ultra 推理速度提升 5 倍，复杂智能体任务成本降低高达 30%。该模型旨在解决当前开源模型在长周期、高复杂度任务中推理慢、成本高的问题，为开发者提供更高效的智能体基础设施。

AI模型 NVIDIA Nemotron 3 Ultra MoE 开源模型智能体

推荐理由：做智能体开发和部署的团队终于有了一个开源的高效选择——Nemotron 3 Ultra 直接降低长任务推理成本 30%，建议关注并测试其在实际 agent 场景中的表现。

原文