全部 AI 动态 · AI 热点

6月30日

03:09

marktechpost@Asif Razzaq

精选

NVIDIA 开源了 BioNeMo Agent Toolkit，将 OpenFold3、DiffDock 和 GenMol 等生物分子模型包装为 AI 代理可直接调用的技能。每个技能包含模型用途、输入、输出和失败模式说明。在 NVIDIA 使用 Codex CLI 和 GPT-5.5 fast 的基准测试中，该工具将任务完成率从 57.1% 提升至 100%，并实现 token 效率翻倍。

AI产品 NVIDIA BioNeMo Agent Toolkit OpenFold3 DiffDock 药物发现

推荐理由：NVIDIA 开源了这个工具，让 AI 代理能直接调用分子模型做药物发现。用上它任务完成率翻倍还省 Token，做生物计算的同学可以试试。

原文

6月29日

18:57

vLLM@vllm_project

精选

NVIDIA 与 vLLM 合作发布 step-by-step 指南，教你用四台 DGX Spark 盒子组建私有集群，自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器，可提供兼容 OpenAI 的端点。无需数据中心，适合构建私有 agent 工作流。

技巧 Nemotron-3-Ultra NVIDIA DGX Spark vLLM 自托管

推荐理由：想不依赖数据中心自己跑 550B 模型？NVIDIA 出了详细教程，四台 DGX Spark 就能拼出 OpenAI 兼容的端点。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

在Flink Forward Asia Shenzhen 2026上，NVIDIA的Chuan Chen介绍了与阿里云的技术合作。双方通过CUDA库加速Apache Flink的多模态数据流处理。这一开源协作实现了端到端高性能多模态流式架构，适用于AI评论、实时图文流和交互式问答。

行业 NVIDIA Alibaba Cloud Apache Flink CUDA 多模态

推荐理由：NVIDIA和阿里云用CUDA把Flink的多模态数据处理速度拉满了，想做实时AI评论或图文问答的可以看看这个架构。

原文

09:39

09:39IT之家（博客/媒体）

精选78°

澳大利亚云服务商 Firmus 宣布在印尼峇淡建设一座 360MW 的 AI 工厂，采用 NVIDIA DSX 液冷方案。该工厂由 Firmus 与 DayOne 合作开发，电力容量达 360MW。根据与 NVIDIA 至 2034 年的战略合作，NVIDIA 将在明后两年交付 Grace Blackwell、Vera Rubin、Vera 等多代算力硬件，总计 17 万颗 GPU。Firmus 预计前六年从已承诺承购协议中获得 250~300 亿美元收入。NVIDIA 还是 Firmus 今年四月股权融资的有条件参与方。

行业 NVIDIA Firmus AI工厂 Grace Blackwell Vera Rubin

推荐理由：想了解超大规模 AI 数据中心怎么建？Firmus 联手 NVIDIA 在印尼搞了个 360MW 的大项目，17 万颗 GPU，仅硬件收入就有 300 亿美元，值得一读。

原文

6月28日

22:27

NVIDIA AI@NVIDIAAI

NVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon，要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理，以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits，第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits，第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日（周二）前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。

行业 NVIDIA Stripe Nous Research Hermes Agent DGX Spark 智能体黑客松

推荐理由：想赢一台 DGX Spark 吗？用 Hermes Agent 造个自动赚钱的 AI 公司，前三名都有现金加硬件，截止 6 月 30 日，快上车。

原文

6月27日

21:12

LMSYS Org (SGLang)@lmsysorg

精选

英伟达与智谱AI合作，发布了基于GLM-5.2的NVFP4量化检查点。该模型为744B参数混合专家架构（40B活跃参数），专注于推理和编码任务。NVFP4量化通过NVIDIA Model Optimizer实现，在降低内存占用的同时保持前沿推理性能。模型还支持稀疏注意力和IndexShare索引器，实现高效长上下文处理。目前已在Blackwell/Grace Blackwell上通过SGLang提供首日支持。

AI模型 GLM-5.2 NVFP4 NVIDIA SGLang 推理模型

推荐理由：英伟达把GLM-5.2压缩成NVFP4，内存省一大截，推理编码在Blackwell上直接跑，SGLang第一时间就能用。

原文

13:54

vLLM@vllm_project

精选

NVIDIA发布GLM-5.2的NVFP4检查点，在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行：vllm serve nvidia/GLM-5.2-NVFP4。

AI模型 GLM-5.2 NVFP4 vLLM NVIDIA 推理模型

推荐理由：想省显存又不想降精度？GLM-5.2的NVFP4版在vLLM上线了，比FP8省一半内存，推理编码长文本都稳。

原文

11:39

marktechpost@Sana Hassan

精选

本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集，无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。

技巧 NVIDIA Open-SWE-Traces Hugging Face 微调编程助手

推荐理由：想自己动手做代码智能体微调数据？这教程手把手教你解析NVIDIA开源的Open-SWE-Traces，连Token预算和工具使用指标都算好了。

原文

6月26日

16:55

Geek@geekbb

精选

NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本，命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供，限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。

AI模型 nvidia/GLM-5.2-NVFP4 智谱 NVIDIA Hugging Face 推理模型

推荐理由：NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度，放 Hugging Face 上免费调，还能白嫖，日常推理够用了。

原文

10:10

NVIDIA AI@NVIDIAAI

精选

NVIDIA与Linux基金会及行业伙伴共同启动Akrites计划，旨在应对AI驱动的开源软件安全威胁。NVIDIA首席安全官David Reber强调透明与开放协作对AI时代安全至关重要。Akrites将建立共享安全事件响应团队（SIRT）和标准化保密披露流程，在漏洞被利用前进行上游修复。该计划特别针对AI可在数分钟内发现软件漏洞的新挑战。

行业 NVIDIA Linux基金会 Akrites AI安全开源安全

推荐理由：NVIDIA和Linux基金会牵头搞了个Akrites，专门对付AI快速找漏洞的问题，还建了共享安全响应团队，挺实在的。

原文

6月25日

05:57

a16z@a16z

76°

AI 初创公司 Mirendil 宣布完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 共同领投，NVIDIA 等参投。公司由 Behnam Neyshabur 联合创立，团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 提出“自加速 AI”概念，让 AI 像科学家一样在特定领域积累深度专业知识，从而加速自身研发进程，并计划将这一能力开放给更多科研机构和企业。

行业 Mirendil a16z NVIDIA 融资自加速 AI

推荐理由：Mirendil 刚融了 2 亿美元，要造能自己加速研发的 AI，团队全是前沿机构出来的，想法挺前沿。

原文

04:57

Marc Andreessen@pmarca

73°

新创公司 Mirendil AI 今日宣布完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 领投，NVIDIA 跟投。公司由 Behnam Neyshabur 等四位联合创始人领导，核心团队共 20 名研究者与工程师，来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 定位于构建自加速 AI 研发系统，目标是通过 AI 推动科学进步，并主张让更多实验室自主控制 AI 基础设施。

行业 Mirendil a16z Kleiner Perkins NVIDIA 融资

推荐理由：a16z 和 Kleiner Perkins 联手投了两亿美元，团队全是大厂顶尖人才，就是要搞AI自己加快研究速度的路子，跟传统实验室玩法不同。

原文

04:21

a16z@a16z

81°

Mirendil AI 完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 联合领投，NVIDIA 参与投资。该公司正构建一个专精 AI 研发的自主系统，类似为研究设计的编码智能体，可自行控制 GPU 并循环执行科研与工程任务。创始团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。

行业 Mirendil a16z NVIDIA 融资自主AI研究

推荐理由：Mirendil 要做让 AI 自己搞 AI 研发的系统，2 亿美元种子轮，团队来自顶尖实验室，目标是打破大厂垄断。

原文

03:27

NVIDIA AI@NVIDIAAI

精选

NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3，允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能，如搜索、摘要、警报、报告和片段审查。提供统一开源仓库，附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告，集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别，并取得 SOTA 性能。

AI模型 NVIDIA Metropolis VSS 3 视频搜索智能体

推荐理由：NVIDIA 刚发了 VSS 3，你的编程代理现在能用一句话搜索、总结视频了，新增16种技能和3D追踪，比以前好用得多。

原文

01:12

NVIDIA AI@NVIDIAAI

76°

NVIDIA 发布了 NeMo AutoModel，基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核，仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分，专为大规模模型构建设计。

AI产品 NeMo AutoModel MoE Hugging Face Transformers v5 训练加速 NVIDIA

推荐理由：NVIDIA 出了个 NeMo AutoModel，基于 Hugging Face Transformers v5，几行代码就能给 MoE 模型训练加速 3 倍以上，搞大模型训练的值得看看。

原文

00:51

00:51Hugging Face: Blog（博客/媒体）

精选

NVIDIA 发布 NeMo AutoModel，通过自动化模型并行、混合精度训练和梯度检查点，简化 Transformer 模型微调流程。该工具可自动检测硬件配置，支持多 GPU 分布式训练，无需手动调整参数。在微调 BERT-base 模型时，相比标准 PyTorch 实现，NeMo AutoModel 将训练时间缩短约 40%，并保持相同精度。

技巧 NVIDIA NeMo AutoModel Transformer 微调

推荐理由：NVIDIA 搞了个 NeMo AutoModel，能自动帮你加速微调 Transformer 模型，省去手动调参的麻烦，速度还快很多，适合想快速出结果的人。

原文

6月24日

13:13

vLLM@vllm_project

vLLM 项目宣布支持 DFlash 投机解码，用户只需将 EAGLE-3 检查点替换为 DFlash 检查点即可启用，无需修改代码。该功能通过开源 Speculators 库将 DFlash 草案模型与目标模型的隐藏状态连接。在单块 Blackwell Ultra GPU 上运行 Gemma-4 31B 模型，Math500 基准取得 5.8 倍吞吐量提升，GSM8K 提升 5.3 倍，HumanEval 提升 5.6 倍，MBPP 提升 4.4 倍。

AI模型 DFlash vLLM Gemma-4 NVIDIA 推理优化

推荐理由：vLLM 和 NVIDIA 合作推出 DFlash 投机解码，Gemma-4 31B 推理速度提升近 6 倍，配置只需改一行 checkpoint 路径。

原文

09:58

Pandaily@contact@pandaily.com (Pandaily)

NVIDIA、高通等芯片巨头正在加码具身AI芯片赛道。多家公司发布了针对人形机器人等应用的专用芯片方案。市场争夺日趋白热化，各厂商正通过差异化设计和生态合作抢占先机。

行业 NVIDIA Qualcomm 具身智能芯片市场动态

推荐理由：NVIDIA和高通都在押注具身AI芯片，看看他们谁能笑到最后。

原文

03:18

NVIDIA AI@NVIDIAAI

精选

NVIDIA发布DFlash，一种开源轻量级块扩散模型，专为投机解码设计。在NVIDIA Blackwell硬件上，DFlash可实现高达15倍的推理吞吐量提升，同时保持相同的用户交互响应速度。与传统逐token解码不同，DFlash一次生成整个token块，由主模型并行验证。该方案即插即用，已集成到SGLang、TensorRT-LLM和vLLM等框架中。

AI模型 DFlash NVIDIA Blackwell 投机解码开源模型

推荐理由：NVIDIA开源了DFlash，用块扩散投机解码让Blackwell推理提速15倍，还支持SGLang和vLLM，随手就能用。

原文

01:02

LMSYS Org (SGLang)@lmsysorg

79°

与NVIDIA合作，在GB300上使用SGLang服务DeepSeek-V4，实现5倍吞吐量提升（~2,200→~11,200 tok/s/GPU，交互性~50 tok/s/user）。借助MTP，在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍，峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化（MXFP4）且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。

AI模型 DeepSeek-V4 GB300 SGLang 推理优化 NVIDIA

推荐理由：想用SGLang在GB300上榨干DeepSeek-V4？NVIDIA合作实测，吞吐翻5倍，交互延迟不变，MTP和量化细节全公开。

原文

6月23日

17:03

Aravind Srinivas@AravSrinivas

据曼哈顿研究所数据，美国数据中心仅占每日用水量的0.2%。传统冷却系统每MW每年消耗约260万加仑水，而采用45°C液冷技术的AI工厂在适宜气候下可使用干冷却器，将设施冷却水消耗降至接近零。NVIDIA指出，液冷不仅提升水效和能效，还创造了余热回收和社区供暖机会。这一转变颠覆了公众对AI数据中心大量耗水的印象。

行业 NVIDIA 液冷数据中心 AI可持续水消耗

推荐理由：反常识吧？液冷能让AI工厂几乎不耗水，还顺带回收热能, 值得看看数据。

原文

16:58

Julien Chaumond@julien_c

曼哈顿研究所数据显示，美国数据中心用水仅占全美日用水量的0.2%。采用45°C液冷技术后，AI工厂在适宜气候下可用干冷器替代冷却塔，将设施冷却用水从约每年每MW 260万加仑降至接近零。液冷技术同时提升能效，并支持热量回收与社区供暖，使数据中心成为电网资产。

行业 NVIDIA 液冷数据中心能效

推荐理由：NVIDIA用液冷把数据中心用水几乎干到零，还顺便回收热量给社区，环保和算力两不误。

原文

15:58

15:58IT之家（博客/媒体）

Valve 发布了 SteamOS 3.8 版本，但目前仅支持 AMD 的 GPU。Valve 员工 Pierre-Loup Griffais 在接受 The Verge 采访时透露，团队正在为 SteamOS 开发 NVIDIA 显卡驱动程序支持，并与 NVIDIA 密切合作。虽然该支持可能不会在今年推出，但 Valve 已将其列为幕后重点方向。

行业 Valve SteamOS NVIDIA 显卡兼容 Linux游戏

推荐理由：Valve 官方确认 SteamOS 正在开发 N 卡支持，虽然今年可能出不来，但这是 Linux 游戏平台的关键一步。

原文

14:06

lmarena.ai@lmarena_ai

NVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11（两个变体），整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。

AI模型 Cosmos-3-Super NVIDIA Text-to-Image Arena 文本到图像开源模型

推荐理由：NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平，想试试免费好用的生成工具可以关注它。

原文

13:13

arXiv cs.AI@Prateek Agnihotri, Sanchit Jain, Prabhat Agnihotri, Aditya Prasad, Shubham Jain

这篇论文介绍了在NVIDIA Nemotron Model Reasoning Challenge中解决Bit Manipulation Puzzles的创新算法。该任务要求发现隐藏的逻辑规则并应用于新输入，但LLMs通常因复杂布尔逻辑模拟而幻觉。作者提出放弃算术逻辑，转而使用字符串相似性、结构化搜索和自主错误恢复。他们将逻辑门推导重构为基选择任务，利用最小比特翻转来隔离基并推导真值表，无需复杂算术。通过回溯DFS和错误恢复，结合比特分词和交互推理SFT，该方法在验证集上达到96%以上的准确率，最终获得比赛第7名。

论文 NVIDIA Nemotron Bit Manipulation Puzzles 推理模型 LLM

推荐理由：这篇论文用字符串相似度和回溯搜索替代了算术逻辑，让LLM在位操作谜题上验证精度超过96%，比赛第7名，方法很巧妙。

原文

10:23

Pandaily@contact@pandaily.com (Pandaily)

72°

Intel的CPU复苏、Broadcom的定制ASIC扩张以及云巨头自研芯片正重塑AI算力格局。这些挑战者试图从不同角度分食NVIDIA在AI训练和推理市场的份额。具体包括Intel的Xeon处理器提升AI性能，Broadcom为谷歌等客户设计的TPU持续迭代，以及亚马逊Trainium、谷歌TPU等云自研芯片逐步规模化。

行业 NVIDIA Intel Broadcom AI芯片算力竞争

推荐理由：Intel、Broadcom和云巨头都在动NVIDIA的蛋糕，这篇梳理了各家具体动作，让你看清AI芯片战局。

原文

09:48

09:48IT之家（博客/媒体）

76°

NVIDIA 宣布 Vera Rubin NVL4 平台将于 2026Q4 上市。该平台集成 4 颗 Rubin GPU 和 2 颗 Vera CPU，采用第六代 NVLink 协议和 NVLink-C2C 互连。与 Grace Hopper 相比，其科学计算模拟性能提升 4 倍，科学 AI 训练性能提升 6 倍，科学 AI 推理性能提升 8 倍。系统兼容液冷 NVIDIA MGX 模块化服务器，专为现代超级计算优化。

AI产品 NVIDIA Vera Rubin NVL4 Grace Hopper 超级计算

推荐理由：NVIDIA 发了 Vera Rubin NVL4，2026 年底上市，科学计算比 Grace Hopper 快 4 倍，AI 训练快 6 倍，搞超算和 AI 的可以盯一下。

原文

6月22日

10:23

10:23IT之家（博客/媒体）

鸿海董事长刘扬伟6月18日在台湾地区工商协进会会员大会上表示，基于NVIDIA Vera Rubin平台打造1GW规模的AI数据中心需要470亿美元资本支出。单一个Vera Rubin机架价格为910万美元，1GW数据中心共需约3557个各类机架。每年电力支出达13亿美元，硬件折旧费用为电力成本的六倍。刘扬伟援引外部数据预测，全球数据中心产业规模到2030年将达1.6万亿美元，电力容量将从2024年的68GW增至174GW。

行业 Vera Rubin NVIDIA 英伟达数据中心资本支出

推荐理由：刘扬伟算了笔账：建1GW的Vera Rubin数据中心要470亿美元，单机柜910万，电费一年13亿。想了解AI数据中心的真实成本？看这篇。

原文

6月20日

06:57

marktechpost@Asif Razzaq

NVIDIA AI推出了SpatialClaw，这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行，将代码作为动作接口。SpatialClaw能够组合多种感知工具，实现3D空间推理。这种设计免去了传统微调或训练步骤。

AI模型 SpatialClaw NVIDIA Python 智能体 3D空间推理

推荐理由：NVIDIA搞了个叫SpatialClaw的智能体，不用训练，直接用写Python代码的方式做3D空间推理，挺创新的。

原文

03:52

Nous Research@NousResearch

精选

Nous Research联合NVIDIA和Stripe启动Hermes Agent加速商业黑客马拉松，鼓励构建能自主执行商业操作的AI代理。NVIDIA提供NemoClaw安全运行、Nemotron 3 Ultra快速推理及代理技能支持。Stripe新Skills让代理能自主购买服务、订阅SaaS。总奖金包括$17,500现金、3台NVIDIA DGX Spark及$9,000 Stripe Credits。提交截止6月30日。

行业 NVIDIA Stripe Nous Research Hermes Agent 智能体

推荐理由：想让你造的AI代理自己挣钱花钱？这个黑客马拉松有NVIDIA和Stripe支持，奖品有现金和DGX Spark，值得试试。

原文

6月19日

18:42

Together AI@togethercompute

Together AI的James Zou与NVIDIA的Venkat Srinivasan将于7月1日在AI Engineer World's Fair上讨论开放模型如何实现集体智能。该活动聚焦开源模型在协作智能系统中的作用。演讲将结合两家公司的技术实践，分析开放模型对多智能体架构的影响。

行业 Together AI NVIDIA 开放模型 AI Engineer World's Fair

推荐理由：想了解开放模型怎么支撑多智能体协作？Together AI和NVIDIA的人要聊这个，7月1日别错过。

原文

18:19

pandaily@contact@pandaily.com (Pandaily)

73°

Coherent、Nokia、JX Advanced Metals 等全球光芯片厂商宣布扩大产能，以满足AI数据中心对高速互联的需求。NVIDIA 为此投资20亿美元，锁定光子互连供应链。这些扩产计划预计在2026年前完成，以支撑下一代AI网络架构。

行业 Coherent Nokia JX Advanced Metals NVIDIA 光芯片 AI数据中心

推荐理由：光芯片是AI数据中心的血管，英伟达砸20亿锁定供应，可以了解一下三巨头各自的扩产计划

原文

6月18日

09:39

marktechpost@Sana Hassan

精选

本教程演示如何使用 NVIDIA SkillSpector 对 AI 技能进行安全风险预部署扫描。通过构建良性和故意含漏洞的技能语料库，利用 SkillSpector 的 LangGraph 工作流进行扫描，并用 pandas 整理风险评分与发现。结果导出为 SARIF 格式，支持自定义分析器和可选的 LLM 语义分析。该流程覆盖静态分析、风险分类可视化及报告生成。

技巧 NVIDIA SkillSpector SARIF AI安全静态分析

推荐理由：NVIDIA 教你用 SkillSpector 做 AI 技能安全扫描，从写语料到出 SARIF 报告，一步一步都有代码，适合想加固 AI 应用的开发者。

原文

6月17日

23:17

AI Will@FinanceYF5

73°

NVIDIA在SIGGRAPH 2026上发布MotionBricks，该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟，让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计，能动态生成自然动作。

AI模型 MotionBricks NVIDIA 游戏角色机器人动作生成

推荐理由：NVIDIA搞了个MotionBricks，35万种动作技能随便切换，游戏角色和机器人动起来更自然了，比以前的方案快很多。

原文

07:25

07:25IT之家（博客/媒体）

83°

英伟达在MLPerf Training 6.0七项基准测试中全部夺魁，Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统，在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载，刷新了大规模训练效率纪录。

AI模型 NVIDIA Blackwell DeepSeek-V3 MLPerf 训练基准

推荐理由：英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟，比上代快60%，性能真狠。

原文

06:04

NVIDIA AI@NVIDIAAI

73°

NVIDIA Research 推出 SpatialClaw，一个无需训练的智能体，通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块，检查中间结果并跨步骤调整策略。感知输出作为普通变量，可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分，在 6 种不同模型骨干上表现稳定。

AI模型 SpatialClaw NVIDIA 智能体多模态视觉推理

推荐理由：SpatialClaw 不用额外训练，靠写代码搞定复杂视觉任务，在 20 个基准上平均提升 11.2 分，还兼容多种模型。

原文

03:03

berryxia@berryxia

73°

NVIDIA开源了SOMA-X v0.2，一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性，采用Apache 2.0许可证。它专为机器人和物理AI设计，可用于机器人训练、物理仿真和动作迁移，解决了不同机器人体型不统一导致动作数据难以复用的问题。

AI模型 SOMA-X NVIDIA 3D人体模型机器人物理AI

推荐理由：NVIDIA开源了SOMA-X v0.2，单一骨架就能适配不同体型，机器人动作数据复用门槛降低，训练效率提升。

原文

01:58

Jim Fan@jimfan

精选72°

ENPIRE赋予8个Codex智能体机器人集群和GPU资源，自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。

AI产品 ENPIRE Codex NVIDIA 智能体机器人

推荐理由：NVIDIA让8个AI智能体自己控制机器人干活，还能绑扎带装显卡，而且要开源，你可以在家搭机器人实验室了！

原文

01:57

Jim Fan@jimfan

76°

NVIDIA联合CMU和伯克利推出ENPIRE系统，让AI智能体完全自主控制真实机器人循环，包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化，无需人类介入。

AI模型 ENPIRE NVIDIA 机器人智能体自主循环

推荐理由：NVIDIA搞了个ENPIRE，让AI自己操控机器人反复试错，真实任务成功率干到99%，连GPU都能自己插。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

16:34

AI Will@FinanceYF5

83°

NVIDIA 发布了 SANA-Streaming 模型，支持对长达一分钟的视频进行实时编辑。用户可以在视频播放过程中更改服装、背景、风格和场景。该模型无需等待渲染，即可直接看到修改结果。

AI模型 NVIDIA SANA-Streaming 视频生成实时编辑

推荐理由：NVIDIA 出了 SANA-Streaming，放视频时就能实时换衣服换背景，一分钟的长视频也能改

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？