14:23AlphaSignal@AlphaSignalAI精选NVIDIA开源了AI技能安全扫描器SkillSpector。研究发现26.1%的已发布AI技能存在漏洞,36%包含提示注入向量。SkillSpector无需扫描恶意代码即可检测危险特性,帮助开发者避免在安装未扫描技能时的常见风险。该工具专为检查AI技能潜在安全问题设计,可集成到开发流程中。AI产品NVIDIASkillSpectorAI安全提示注入开源工具7 个信源在谈推荐理由:NVIDIA开源了SkillSpector,专门扫描AI技能的漏洞和提示注入。别像99%的开发者那样不检查就直接装,先扫一下再安心用。原文
19:30pandaily@contact@pandaily.com (Pandaily)NVIDIA拉丁美洲负责人否认Anthropic关于该地区成为受限AI芯片流入中国渠道的指控。该负责人同时表达了对美国出口管制政策的不满。Anthropic此前指控称,部分受限芯片通过拉丁美洲转运至中国。NVIDIA强调其遵守所有出口法规,并否认存在违规行为。行业NVIDIAAnthropic芯片出口管制拉丁美洲AI芯片10 个信源在谈推荐理由:NVIDIA正面回应芯片走私指控原文
13:12MiniMax_AI@MiniMax_AIMiniMax 宣布其 M3 模型端点获得 NVIDIA 官方认可,并已上线免费 GPU 加速版本。用户现在可以免费体验基于 NVIDIA GPU 加速的 M3 模型推理服务。该端点支持高性能计算,适用于多种 AI 任务。AI产品MiniMaxM3NVIDIAGPU加速3 个信源在谈推荐理由:MiniMax 的 M3 模型免费加速了原文
11:20AI Will@FinanceYF5Lilly、Novartis和J&J与Isomorphic Labs达成合作,投入数十亿美元用于AI设计的药物。Lilly还与NVIDIA启动了一项AI药物发现计划。Synaptic Data梳理了AI药物发现技术栈8层上的110+家初创公司。行业Isomorphic LabsLillyNovartisJ&JNVIDIAAI药物发现8 个信源在谈推荐理由:三大药企联手AI公司砸钱原文
11:05lmarena.ai@lmarena_ai精选NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名,在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出,但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽,排名仍在稳定中。AI模型Nemotron 3 UltraNVIDIAAgent Arena开源模型智能体10 个信源在谈推荐理由:NVIDIA 开源模型在智能体评测中排第5原文
09:55rohanpaul_ai@rohanpaul_ai精选73°NVIDIA 发布了首个智能体 AI 基准测试 AgentPerf 的结果。该基准由 Artificial Analysis 推出,测试系统在保持响应性的同时能并发运行多少个智能体。GB300 NVL72 在最低服务层级达到每兆瓦 61.4K 并发智能体,而 H200 仅为 2.6K,性能提升约 23.6 倍。测试模拟了真实编码智能体路径,涵盖 12 种以上编程语言,请求长度从 5K 到 131K token 不等,平均约 27K token。性能提升得益于 72 块 GPU 通过 NVLink 组成机架级系统,以及优化 MoE 专家分配、通信与计算重叠等软件技术。AI模型NVIDIAGB300 NVL72H200AgentPerf智能体10 个信源在谈推荐理由:NVIDIA 首个智能体基准,GB300 比 H200 强 23 倍原文
13:34Thinking Machines Lab@thinkymachines83°Think Machines 宣布与 NVIDIA 合作,利用其硬件和平台来训练前沿模型,并提供可定制的 AI 解决方案。这一合作将加速模型训练效率,降低开发门槛,使企业能够更灵活地部署定制化 AI。NVIDIA 的算力支持将帮助 Think Machines 在竞争激烈的 AI 市场中提升模型性能。行业NVIDIAThink Machines模型训练AI 定制合作10 个信源在谈推荐理由:NVIDIA 与 Think Machines 的合作意味着更强大的算力支持,做模型训练和定制 AI 的团队可以关注这一进展,看看能否利用其平台加速自己的项目。原文
12:50Artificial Analysis@ArtificialAnlys精选随着用户和企业赋予 AI 模型和智能体更多自主权,筛选其输入输出的护栏变得至关重要。然而,现有的护栏评测基准未能跟上模型智能的发展速度。与 NVIDIA 合作,该团队在三个开放数据集上独立评测了护栏与审核模型,衡量了检测质量、延迟以及捕捉不安全内容与过度拒绝安全内容之间的权衡。结果显示,没有模型能全面胜出,且缺乏统一的评判标准。这被视为一个测量问题的早期步骤,随着模型承担更多实际工作,该问题将愈发重要。行业AI 安全护栏评测NVIDIA模型审核智能体10 个信源在谈推荐理由:AI 安全护栏评测标准滞后,做模型部署和安全审核的团队需要关注这个评测缺口,建议点开了解当前护栏模型的真实表现。原文
12:42Sebastian Raschka@rasbt精选Nemotron 3 Ultra 是 NVIDIA 发布的新一代开源权重模型,延续了前代 Super 变体的 Mamba-2 注意力混合架构和 LatentMoE 设计,但规模更大。该模型在能力与效率之间取得了极佳平衡,性能表现令人印象深刻。开源权重意味着开发者可以自由下载、微调和部署,适合资源受限但追求高性能的场景。这一发布进一步丰富了开源大模型生态,为研究者和工程师提供了新的选择。AI模型Nemotron 3 UltraMamba-2LatentMoE开源/仓库NVIDIA10 个信源在谈推荐理由:NVIDIA 把 Mamba-2 混合架构和 LatentMoE 做到更大更强,追求高性价比模型的团队可以直接拿来用,省去从头训练的昂贵成本。原文
12:31karminski-牙医 (AI工具)@karminski3精选Google发布了Gemma小模型的Diffusion版本,名为Diffusion Gemma,大小26B但激活参数量仅4B。与NVIDIA合作针对RTX 4090和5090优化,5090上每秒可生成700+ token。Diffusion模型像刮奖一样逐片生成文本,速度远快于传统逐字生成模型,但输出质量略低。在AIME 2026数学测试中达到Gemma4-26B-A4B的94%水平,在Agent能力测试中达到82%。4bit量化版本仅需16G显存即可运行。AI模型Diffusion模型GemmaGoogleNVIDIA推理加速10 个信源在谈推荐理由:Diffusion Gemma把文本生成速度拉到单卡700TPS,做实时对话或高吞吐推理的团队可以直接用,4bit量化16G显存就能跑,值得试试能否做投机解码的草稿模型。原文
12:29Mira Murati (TML)@miramurati前 OpenAI CTO Mira Murati 在 X 上发文感谢 NVIDIA CEO Jensen Huang 及其团队的支持,宣布双方合作部署至少 1GW 的 Vera Rubin 系统。该系统旨在将可适应的协作 AI 带给每个人,标志着 AI 基础设施的大规模扩展。Vera Rubin 是 NVIDIA 下一代 AI 计算平台,此次合作将显著提升 AI 训练和推理能力。行业NVIDIAVera RubinAI 基础设施合作Mira Murati10 个信源在谈推荐理由:AI 基础设施的规模化部署是行业关键瓶颈,关注算力布局的团队和开发者值得了解这一合作动向。原文
07:02NVIDIA AI@NVIDIAAINVIDIA 宣布将参加 2026 年在洛杉矶举办的 SIGGRAPH 大会,展示神经渲染、世界模型、物理 AI 等前沿技术,并提供动手实验室。SIGGRAPH 是计算机图形学与交互技术领域的顶级会议,NVIDIA 的参与意味着其最新图形与 AI 研究成果将集中亮相。对于图形开发者、AI 研究者和游戏行业从业者来说,这是了解下一代渲染与仿真技术的重要窗口。行业NVIDIASIGGRAPH 2026神经渲染物理 AI世界模型9 个信源在谈推荐理由:NVIDIA 把 SIGGRAPH 当作技术风向标,做图形渲染、物理仿真或 AI 模型的团队值得关注,可以提前规划参会或跟进后续发布。原文
06:16NVIDIA AI@NVIDIAAI精选NVIDIA Research发布开放模型MotionBricks,基于35万+运动片段实现每秒15,000帧的实时角色动画。该模型无需手工制作过渡或微调,可直接用于角色动画,并支持机器人应用。相关论文将发表于SIGGRAPH 2026,代码和演示已开源。AI模型MotionBricksNVIDIA角色动画实时机器人10 个信源在谈推荐理由:NVIDIA开源实时动画,35万片段15K FPS原文
04:41NVIDIA AI@NVIDIAAINVIDIA 发布 Nemotron 3 模型,采用混合 Mamba Transformer 架构,通过 Mamba-2 降低注意力机制开销,实现亚二次复杂度。潜在 MoE 通过降维投影减少 HBM 与 SRAM 间的数据移动,并增加专家数量以提升稀疏性效率。多 token 预测(MTP)使模型在训练时能预见未来 token,推理时可用于推测解码。模型采用新的 OpenMDW 1.1 许可证。AI模型Nemotron 3混合 Mamba Transformer潜在 MoE多 token 预测NVIDIA10 个信源在谈推荐理由:Nemotron 3 的架构创新直击大模型推理效率瓶颈,做模型优化和部署的开发者值得关注其混合 Mamba 和潜在 MoE 的具体实现,可以直接参考其设计思路。原文
04:04Together AI@togethercompute精选Trajectory Labs 在 Together Compute 和 NVIDIA 的支持下,仅用不到 24 小时就在一个开放模型上实现了前沿模型级别的性能。这展示了当优秀开源模型与合适的训练基础设施结合时,可以快速取得显著成果。Together Compute 为此提供了算力支持,凸显了开放模型生态的潜力。AI模型开放模型后训练算力基础设施Together ComputeNVIDIA10 个信源在谈推荐理由:对于关注开源模型训练效率的团队,这个案例证明了 24 小时内就能让开放模型达到前沿水平,值得研究其训练流程。原文
03:08NVIDIA AI@NVIDIAAINVIDIA 推出了 Brev Launchables 和 Agent Skills,用于生成物理 AI 的合成数据。这些工具旨在解决物理 AI 训练数据稀缺的问题,通过自动化生成高质量合成数据,加速机器人、自动驾驶等物理 AI 应用的开发。Brev Launchables 提供可复用的数据生成环境,Agent Skills 则赋予智能体自主执行数据采集任务的能力。这对从事物理 AI 研究的团队来说是一个重要的基础设施更新。AI产品NVIDIA物理AI合成数据Brev LaunchablesAgent Skills8 个信源在谈推荐理由:物理 AI 训练数据难获取是行业痛点,NVIDIA 这套工具直接降低了合成数据门槛,做机器人或自动驾驶的开发者值得关注,可以大幅减少手动标注成本。原文
00:35NVIDIA AI@NVIDIAAI精选NVIDIA 发布了 Cosmos 3,这是一个专为机器人和物理 AI 设计的基础模型平台。该平台旨在加速机器人感知、规划和交互能力的开发,通过提供预训练模型和工具链,降低物理 AI 应用的门槛。Cosmos 3 支持多模态输入,能够生成高保真的物理世界模拟,帮助开发者更快地训练和部署机器人系统。这一发布标志着 NVIDIA 在物理 AI 领域的重要布局,有望推动机器人技术从实验室走向实际应用。AI产品机器人物理AINVIDIA基础模型仿真5 个信源在谈推荐理由:NVIDIA Cosmos 3 为机器人开发者提供了现成的物理 AI 基础模型,省去了从零训练的时间和成本,做机器人感知或仿真的团队可以直接上手试试。原文
10:40Ate-a-Pi@svpinoNVIDIA 与微软合作推出两款新设备:DGX Station 搭载 GB300 超级芯片,最高 748GB 内存;RTX Spark 笔记本拥有 1 petaflop AI 性能和 128GB 统一内存。这些硬件配置极为强大,面向 AI 开发者和研究人员。DGX Station 适合本地训练大型模型,而 RTX Spark 则提供便携的高性能 AI 计算能力。此举将推动边缘 AI 和本地部署的普及。AI产品NVIDIA微软DGX StationRTX SparkAI 硬件6 个信源在谈推荐理由:AI 开发者和研究人员终于有了本地高性能计算的新选择——DGX Station 适合模型训练,RTX Spark 适合便携推理,建议关注具体规格和价格。原文
04:44Simon Willison’s Weblog(博客/媒体)76°Google 去年曾短暂发布实验性的 Gemini Diffusion 模型,如今以开源形式回归,推出 DiffusionGemma-26B-A4B-it 模型,采用 Apache 2 许可证。该模型在 NVIDIA NIM 云 API 上免费托管,生成速度可达 500+ tokens/秒。作者实测生成 2409 tokens 仅需 4.4 秒,性能出色。这是 Google 在扩散模型领域的重要开源动作,为开发者提供了高性能的生成式 AI 选项。AI模型GoogleDiffusionGemma开源/仓库NVIDIA生成式AI10 个信源在谈推荐理由:Google 把去年惊艳的扩散模型开源了,做图像/文本生成的开发者可以直接用 NVIDIA 免费 API 体验,速度超 500 tokens/秒,值得立刻上手试。原文
03:06NVIDIA AI@NVIDIAAI76°Google DeepMind 推出实验性开源模型 DiffusionGemma,采用文本扩散技术,每步并行生成 256 个 token,推理速度可达 150+ TPS(DGX Spark)或 1000+ TPS(单张 H100)。该模型激活仅 3.8B 参数,量化后可在 24GB VRAM 消费级 GPU 上运行,适合代码填充、内联编辑等非线性任务。NVIDIA 从首日起提供 BF16/NVFP4 检查点、免费 GPU 加速端点及 vLLM 支持。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。AI模型文本扩散并行生成开源模型Google DeepMindNVIDIA10 个信源在谈推荐理由:文本扩散模型把生成速度拉到新高度,做代码补全或实时编辑的开发者可以直接在 NVIDIA 端点试跑,感受并行 token 的爽感。原文
12:55marktechpost@Sana Hassan精选本文教程展示了如何从 NVIDIA 的 Nemotron-Pretraining-Code-v3 数据集中构建代码数据集管道。通过流式处理而非下载整个数据集,检查其模式并构建可管理的样本。分析了语言、文件扩展名、仓库频率和目录深度等元数据索引结构。然后重构原始 GitHub URL,获取真实源文件,并使用 tiktoken 估算获取代码的 token 规模。该方法适用于大规模代码预训练研究的数据处理。论文NVIDIANemotron-Pretraining-Code-v3代码数据集流式处理tiktoken9 个信源在谈推荐理由:做代码预训练或大规模数据处理的研究人员可以直接复用这套管道,省去下载和解析海量元数据的麻烦,值得一试。原文
20:38PolymarketMoney@PolymarketMoneyNVIDIA($NVDA)与 NBIS($NBIS)联合启动了 Physical AI Living Lab,这是一个专为机器人初创公司设计的实体 AI 实验室。该实验室旨在为初创企业提供物理环境、计算资源和数据支持,加速机器人技术的研发与落地。此举标志着 AI 从虚拟世界向物理世界的延伸,对机器人行业具有重要推动作用。初创公司可借此降低开发门槛,更快实现产品原型测试。AI产品机器人Physical AINVIDIANBIS初创公司8 个信源在谈推荐理由:机器人初创公司终于有了实体 AI 试验场——NVIDIA 和 NBIS 的 Living Lab 解决了从仿真到现实部署的痛点,做机器人开发的团队值得关注,可以直接申请使用。原文
10:31IT之家(博客/媒体)78°Cadence 在 COMPUTEX 2026 上宣布,其 ChipStack AI Super Agent 在 NVIDIA 支持下达到 Level-5 自主水平,成为业界首款全自主芯片设计 AI 虚拟工程师。该智能体基于 Cadence AI 驱动 EDA 产品组合和 NVIDIA Nemotron 模型构建,由 NVIDIA OpenShell 沙箱提供安全保障。它能独立执行复杂的芯片设计和验证工作流程,无需逐步提示,可评估中间结果并自主决策,覆盖规格理解、RTL 生成、验证规划等任务。这标志着芯片设计从 AI 辅助工程师向自主虚拟工程师的跨越,将显著提升资深工程师的设计效率和信心。AI产品芯片设计自主智能体CadenceNVIDIAEDA7 个信源在谈推荐理由:芯片设计团队终于有了能独立干活的 AI 虚拟工程师——ChipStack 从辅助进化为自主执行,做复杂芯片验证的工程师可以直接用它加速迭代,值得点开了解。原文
08:05NVIDIA AI@NVIDIAAI精选72°NVIDIA 在 Blackwell 平台上使用 NVFP4 精度训练了 Llama 3 8B 和 405B 模型。实验结果显示,相比 FP8 精度,NVFP4 实现了 1.31 到 1.73 倍的训练速度提升,且未出现任何精度损失。这一突破意味着大模型训练可以在更短的时间内完成,同时保持模型质量。对于需要大规模训练 AI 模型的团队来说,这能显著降低计算成本和等待时间。AI模型NVIDIABlackwellNVFP4Llama 3训练加速4 个信源在谈推荐理由:训练速度提升 1.3-1.7 倍且零精度损失,做大规模模型训练的团队可以直接在 Blackwell 上尝试 NVFP4,省时省成本。原文
13:36AI Will@FinanceYF5SK hynix与NVIDIA签署了多年合作协议,旨在提前联合设计先进DRAM,避免等待GPU设计完成后再开始内存芯片制造。合作覆盖AI超算、个人AI PC和Jetson机器人平台。SK hynix还将利用NVIDIA工具构建芯片厂数字孪生,在真实产线运行前完成虚拟测试。这表明AI基础设施的军备竞赛已深入内存层,长期联合规划成为关键。行业SK hynixNVIDIAAI基础设施DRAM数字孪生5 个信源在谈推荐理由:AI基础设施的竞争已从GPU延伸到内存,做AI硬件或数据中心规划的团队需要关注——内存的联合设计周期直接影响GPU迭代节奏,提前布局才能不掉队。原文
09:06IT之家(博客/媒体)韩国SK电讯宣布将基于NVIDIA的AI工厂平台DSX建设AI数据中心,目标将AI云服务规模扩展至GW级别。初期采用Blackwell架构GPU,后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运,并计划扩展至整个亚洲,成为亚洲领先的AI云提供商。此外,双方还在机器人仿真和训练平台方面展开合作。行业AI云数据中心NVIDIASK电讯基础设施7 个信源在谈推荐理由:SK电讯的GW级AI云计划标志着电信运营商正式切入AI基础设施赛道,对关注亚洲AI云市场、数据中心建设的从业者来说,这是一个值得跟踪的行业信号。原文
09:00rohanpaul_ai@rohanpaul_ai精选76°SK hynix 与 NVIDIA 宣布建立多年存储合作伙伴关系,共同开发用于下一代 AI 工厂的芯片。合作涵盖 NVIDIA Vera Rubin AI 超级计算机、Vera CPU、RTX Spark 驱动的 PC 和 Jetson Thor 平台的内存。SK hynix 将利用 NVIDIA 的 CUDA-X、PhysicsNeMo、Omniverse 等工具加速芯片设计、半导体仿真和工厂数字孪生。这一合作标志着存储芯片设计不再滞后于 GPU,而是需要提前数年进行协同设计和制造规划。同时,AI 技术也被引入芯片制造本身,用于加速半导体物理、光刻等工程流程。行业NVIDIASK hynixAI 硬件存储芯片数字孪生7 个信源在谈推荐理由:AI 硬件供应链正在重构,存储与计算芯片的协同设计成为关键。做 AI 基础设施、芯片设计或半导体制造的团队,值得关注这一合作如何改变未来 AI 工厂的构建方式。原文
08:25AI Will@FinanceYF588°NVIDIA 近日发布 Nemotron 3 Ultra,这是一款专为长期运行的 AI Agent 设计的旗舰开源模型。该模型采用 550B 参数的 MoE 架构,激活参数仅 55B,推理速度比同级开源模型快 5 倍,Agent 任务成本降低 30%。Nemotron 3 Ultra 旨在解决复杂、长时间运行的 Agent 任务中的效率与成本问题,为开发者提供高性能且经济的选择。该模型的开源特性有望推动 Agent 应用生态的发展。AI模型NVIDIANemotron 3 Ultra开源模型AgentMoE10 个信源在谈推荐理由:做 Agent 开发的团队终于有了一个高性能且成本可控的开源选择——Nemotron 3 Ultra 推理快 5 倍、成本降 30%,值得直接上手试试。原文
15:55marktechpost@Asif Razzaq精选NVIDIA发布了Nemotron 3.5 ASR,一个600M参数的流式语音识别模型。该模型采用cache-aware架构,可从单个检查点实时转录40种语言-区域。它针对低延迟场景优化,支持多种语言的实时语音转文字。AI模型Nemotron 3.5 ASRNVIDIA语音识别流式模型多语言10 个信源在谈推荐理由:600M模型转40语言实时原文
15:44Aadit Sheth@aaditsh72°据一份新文件显示,SpaceX 与 Google 达成协议,从 2026 年 10 月起每月向 Google 提供约 11 万块 NVIDIA GPU 的计算能力,月费高达 9.2 亿美元,合同总额约 300 亿美元。Google 自身拥有 TPU 和庞大云基础设施,却向一家火箭公司租用 GPU,引发行业震动。这可能意味着 Google 的 AI 算力需求已超出自身建设速度,或 SpaceX 在 AI 基础设施方面有未公开的突破。合同允许任何一方在 2026 年 12 月后提前 90 天终止,Google 保留其 AI 模型和数据的知识产权。行业GPU算力租赁GoogleSpaceXNVIDIA8 个信源在谈推荐理由:这则消息揭示了 AI 算力需求已大到连 Google 都要向火箭公司租 GPU,做 AI 基础设施或关注算力瓶颈的从业者值得点开,看看背后到底发生了什么。原文
13:20Perplexity@perplexity_ai72°Perplexity 宣布其 Pro 和 Max 订阅用户现在可以使用 Nemotron 3 Ultra 模型。该模型由 NVIDIA 开发,是一款专为长时间运行的智能体任务设计的新开源模型。此举将高性能的智能体能力直接提供给付费用户,无需额外配置。对于依赖 AI 进行复杂、持续任务的用户来说,这是一个直接可用的新选择。AI产品PerplexityNemotron 3 UltraNVIDIA智能体开源模型10 个信源在谈推荐理由:做长任务智能体的开发者可以直接在 Perplexity 上体验 NVIDIA 的最新开源模型,省去部署成本,值得 Pro/Max 用户试试。原文
08:18NVIDIA AI@NVIDIAAINVIDIA 正式推出 Nemotron 3 Ultra 模型,并同步发布了详细的设置教程,指导用户如何在智能体框架中集成该模型。官方还展示了多个能力演示视频,涵盖推理、编程等场景。该模型旨在提升 AI 智能体的性能,为开发者提供更强大的基础模型选择。教程和演示资源已公开,方便开发者快速上手。AI模型NVIDIANemotron 3 Ultra智能体教程推理模型10 个信源在谈推荐理由:NVIDIA 为智能体开发者提供了开箱即用的教程和演示,做 AI 应用集成的团队可以直接参考,省去自己摸索的时间。原文
08:03Aravind Srinivas@AravSrinivasNVIDIA 最新的开源模型 Nemotron 3 Ultra 现已上线 Perplexity,面向所有 Pro 和 Max 用户开放。该模型专为长时间运行的智能体任务设计,是美国领先的开源模型之一。用户可以直接在 Perplexity 平台上体验其长上下文和推理能力。此举进一步丰富了 Perplexity 的模型选择,为开发者提供了更多开源选项。AI产品Nemotron 3 UltraNVIDIAPerplexity开源模型智能体10 个信源在谈推荐理由:NVIDIA 的 Nemotron 3 Ultra 是专为长时智能体任务设计的开源模型,做 AI 智能体开发的团队可以直接在 Perplexity 上试用,省去本地部署的麻烦。原文
07:51NVIDIA AI@NVIDIAAI72°NVIDIA Research 的 PixelDiT(像素扩散 Transformer)入选 CVPR2026 最佳论文候选。传统图像生成模型依赖预训练自编码器压缩图像后再进行扩散,导致质量损失累积。PixelDiT 完全移除这一步骤,直接在像素空间进行端到端扩散学习,是一种单阶段模型。该方法避免了压缩带来的信息丢失,有望提升生成图像的保真度和细节表现。这一创新为图像生成领域提供了新的技术路径。论文图像生成扩散模型PixelDiTNVIDIACVPR5 个信源在谈推荐理由:NVIDIA 的 PixelDiT 解决了传统扩散模型因预训练编码器压缩导致的质量损失问题,做图像生成的研究者和开发者值得关注——它可能改变现有生成流程的底层设计。原文
03:28Jim Fan@jimfanNVIDIA 研究团队在 CVPR 2026 上展示了三篇关于物理 AI 的论文,分别针对零样本抓取、高效推理和具身智能体训练。GraspGen-X 是首个零样本抓取基础模型,基于数十亿次模拟抓取训练;LCDrive 用紧凑的潜在表示替代昂贵的文本推理;NitroGen 则是一个通用游戏 AI 基础模型,利用 NVIDIA Isaac GR00T 训练具身智能体。这些工作为大规模训练提供了突破性方案,覆盖了机器人操作、自动驾驶和游戏 AI 等关键领域。论文物理 AI零样本抓取具身智能体NVIDIACVPR4 个信源在谈推荐理由:做机器人抓取、自动驾驶或游戏 AI 的开发者,这三篇论文直接给出了可规模化训练的新思路——零样本抓取和紧凑推理方案值得重点关注。原文
02:36NVIDIA AI@NVIDIAAINVIDIA 宣布其 Nemotron Coalition 新增三家成员:@hcompany_ai、@NousResearch 和 @PrimeIntellect。该联盟旨在协作开发前沿开放模型,现有成员包括 Black Forest Labs、Cursor、LangChain、Mistral AI 等。Nemotron 3 Ultra 模型已在联盟成员贡献下完成开发,未来将继续合作推进新模型发布。Prime Intellect 表示将贡献其强化学习基础设施,帮助扩展智能体能力。行业NVIDIANemotron开放模型联盟智能体10 个信源在谈推荐理由:开放模型生态再添生力军,做 AI 模型训练或智能体开发的团队值得关注——联盟协作模式可能加速下一代开源模型落地。原文
22:18Paul Couvert@itsPaulAi72°NVIDIA 发布了开源模型 Nemotron 3 Ultra,专为智能体任务和编程设计。该模型在性能上接近闭源模型 GPT 5.5,但推理成本仅为后者的十分之一($0.051 vs $0.57)。Nemotron 3 Ultra 速度比同类模型快5倍,成本低30%,已在 Hugging Face 上开源。这标志着开源模型与闭源模型之间的质量差距正在迅速缩小,尤其适合处理大型代码库和智能体应用。AI模型NVIDIANemotron 3 Ultra开源模型推理模型编程助手10 个信源在谈推荐理由:开源模型性能逼近闭源,成本却低一个数量级——做智能体或编程的开发者可以直接在 Hugging Face 上试用,省下不少推理预算。原文
19:18marktechpost@Asif RazzaqNVIDIA 推出了 Dynamo Snapshot,这是一个基于 CRIU 和 cuda-checkpoint 工具的系统,用于在 Kubernetes 上对 vLLM 推理工作节点进行快照和恢复。该系统能够显著加速 AI 推理服务的启动时间,解决冷启动延迟问题。通过保存和恢复推理工作节点的状态,Dynamo Snapshot 使得在 Kubernetes 集群中快速扩缩容成为可能,尤其适用于需要频繁调整推理资源的场景。这一工具对于部署大规模 AI 推理服务的团队来说,可以提升资源利用率和响应速度。AI产品NVIDIADynamo SnapshotKubernetesAI推理CRIU9 个信源在谈推荐理由:NVIDIA 用 CRIU 快照解决了 Kubernetes 上 AI 推理的冷启动痛点,做模型推理部署的团队可以直接用这个工具来加速扩缩容,值得关注。原文
08:13lmarena.ai@lmarena_ai精选76°Arena.ai 宣布将 NVIDIA 的 Nemotron 3 Ultra 模型加入其新的 Agent Mode,用于评估 AI 智能体在真实世界中的多步骤任务能力。Agent Arena 通过数百万次真实用户会话,测量模型在编写代码、创建演示文稿、网络研究、构建应用和文档分析等复杂工作流中的表现。评估基于任务成功率、可操控性、错误恢复、用户反馈和工具幻觉五个信号。当前排行榜显示 OpenAI GPT-5.5 排名第一,Anthropic Claude-Opus-4.7 第二,Zai GLM-5.1 第三。该平台已积累超过 30 万任务、200 万次工具调用和 4000 万行代码数据。AI产品智能体评估/基准NVIDIANemotron 3 UltraAgent Arena10 个信源在谈推荐理由:Agent Arena 用真实任务数据解决了智能体评估难的问题,做 AI 智能体开发或选型的团队可以直接参考排行榜和会话信号,比纯基准测试更有说服力。原文
08:12lmarena.ai@lmarena_ai精选83°NVIDIA 今日正式发布 Nemotron 3 Ultra,这是一款 550B 参数的混合专家(MoE)开源模型,定位为前沿智能(frontier-intelligence)模型,专为长时间运行的智能体任务打造。相比其他开源前沿模型,Nemotron 3 Ultra 推理速度提升 5 倍,复杂智能体任务成本降低高达 30%。该模型旨在解决当前开源模型在长周期、高复杂度任务中推理慢、成本高的问题,为开发者提供更高效的智能体基础设施。AI模型NVIDIANemotron 3 UltraMoE开源模型智能体10 个信源在谈推荐理由:做智能体开发和部署的团队终于有了一个开源的高效选择——Nemotron 3 Ultra 直接降低长任务推理成本 30%,建议关注并测试其在实际 agent 场景中的表现。原文