全部 AI 动态 · AI 热点

6月29日

18:57

vLLM@vllm_project

精选

NVIDIA 与 vLLM 合作发布 step-by-step 指南，教你用四台 DGX Spark 盒子组建私有集群，自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器，可提供兼容 OpenAI 的端点。无需数据中心，适合构建私有 agent 工作流。

技巧 Nemotron-3-Ultra NVIDIA DGX Spark vLLM 自托管

推荐理由：想不依赖数据中心自己跑 550B 模型？NVIDIA 出了详细教程，四台 DGX Spark 就能拼出 OpenAI 兼容的端点。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

在Flink Forward Asia Shenzhen 2026上，NVIDIA的Chuan Chen介绍了与阿里云的技术合作。双方通过CUDA库加速Apache Flink的多模态数据流处理。这一开源协作实现了端到端高性能多模态流式架构，适用于AI评论、实时图文流和交互式问答。

行业 NVIDIA Alibaba Cloud Apache Flink CUDA 多模态

推荐理由：NVIDIA和阿里云用CUDA把Flink的多模态数据处理速度拉满了，想做实时AI评论或图文问答的可以看看这个架构。

原文

6月28日

22:27

NVIDIA AI@NVIDIAAI

NVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon，要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理，以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits，第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits，第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日（周二）前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。

行业 NVIDIA Stripe Nous Research Hermes Agent DGX Spark 智能体黑客松

推荐理由：想赢一台 DGX Spark 吗？用 Hermes Agent 造个自动赚钱的 AI 公司，前三名都有现金加硬件，截止 6 月 30 日，快上车。

原文

6月27日

21:12

LMSYS Org (SGLang)@lmsysorg

精选

英伟达与智谱AI合作，发布了基于GLM-5.2的NVFP4量化检查点。该模型为744B参数混合专家架构（40B活跃参数），专注于推理和编码任务。NVFP4量化通过NVIDIA Model Optimizer实现，在降低内存占用的同时保持前沿推理性能。模型还支持稀疏注意力和IndexShare索引器，实现高效长上下文处理。目前已在Blackwell/Grace Blackwell上通过SGLang提供首日支持。

AI模型 GLM-5.2 NVFP4 NVIDIA SGLang 推理模型

推荐理由：英伟达把GLM-5.2压缩成NVFP4，内存省一大截，推理编码在Blackwell上直接跑，SGLang第一时间就能用。

原文

13:54

vLLM@vllm_project

精选

NVIDIA发布GLM-5.2的NVFP4检查点，在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行：vllm serve nvidia/GLM-5.2-NVFP4。

AI模型 GLM-5.2 NVFP4 vLLM NVIDIA 推理模型

推荐理由：想省显存又不想降精度？GLM-5.2的NVFP4版在vLLM上线了，比FP8省一半内存，推理编码长文本都稳。

原文

6月26日

16:55

Geek@geekbb

精选

NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本，命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供，限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。

AI模型 nvidia/GLM-5.2-NVFP4 智谱 NVIDIA Hugging Face 推理模型

推荐理由：NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度，放 Hugging Face 上免费调，还能白嫖，日常推理够用了。

原文

10:10

NVIDIA AI@NVIDIAAI

精选

NVIDIA与Linux基金会及行业伙伴共同启动Akrites计划，旨在应对AI驱动的开源软件安全威胁。NVIDIA首席安全官David Reber强调透明与开放协作对AI时代安全至关重要。Akrites将建立共享安全事件响应团队（SIRT）和标准化保密披露流程，在漏洞被利用前进行上游修复。该计划特别针对AI可在数分钟内发现软件漏洞的新挑战。

行业 NVIDIA Linux基金会 Akrites AI安全开源安全

推荐理由：NVIDIA和Linux基金会牵头搞了个Akrites，专门对付AI快速找漏洞的问题，还建了共享安全响应团队，挺实在的。

原文

6月25日

05:57

a16z@a16z

76°

AI 初创公司 Mirendil 宣布完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 共同领投，NVIDIA 等参投。公司由 Behnam Neyshabur 联合创立，团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 提出“自加速 AI”概念，让 AI 像科学家一样在特定领域积累深度专业知识，从而加速自身研发进程，并计划将这一能力开放给更多科研机构和企业。

行业 Mirendil a16z NVIDIA 融资自加速 AI

推荐理由：Mirendil 刚融了 2 亿美元，要造能自己加速研发的 AI，团队全是前沿机构出来的，想法挺前沿。

原文

04:57

Marc Andreessen@pmarca

73°

新创公司 Mirendil AI 今日宣布完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 领投，NVIDIA 跟投。公司由 Behnam Neyshabur 等四位联合创始人领导，核心团队共 20 名研究者与工程师，来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 定位于构建自加速 AI 研发系统，目标是通过 AI 推动科学进步，并主张让更多实验室自主控制 AI 基础设施。

行业 Mirendil a16z Kleiner Perkins NVIDIA 融资

推荐理由：a16z 和 Kleiner Perkins 联手投了两亿美元，团队全是大厂顶尖人才，就是要搞AI自己加快研究速度的路子，跟传统实验室玩法不同。

原文

04:21

a16z@a16z

81°

Mirendil AI 完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 联合领投，NVIDIA 参与投资。该公司正构建一个专精 AI 研发的自主系统，类似为研究设计的编码智能体，可自行控制 GPU 并循环执行科研与工程任务。创始团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。

行业 Mirendil a16z NVIDIA 融资自主AI研究

推荐理由：Mirendil 要做让 AI 自己搞 AI 研发的系统，2 亿美元种子轮，团队来自顶尖实验室，目标是打破大厂垄断。

原文

03:27

NVIDIA AI@NVIDIAAI

精选

NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3，允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能，如搜索、摘要、警报、报告和片段审查。提供统一开源仓库，附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告，集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别，并取得 SOTA 性能。

AI模型 NVIDIA Metropolis VSS 3 视频搜索智能体

推荐理由：NVIDIA 刚发了 VSS 3，你的编程代理现在能用一句话搜索、总结视频了，新增16种技能和3D追踪，比以前好用得多。

原文

01:12

NVIDIA AI@NVIDIAAI

76°

NVIDIA 发布了 NeMo AutoModel，基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核，仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分，专为大规模模型构建设计。

AI产品 NeMo AutoModel MoE Hugging Face Transformers v5 训练加速 NVIDIA

推荐理由：NVIDIA 出了个 NeMo AutoModel，基于 Hugging Face Transformers v5，几行代码就能给 MoE 模型训练加速 3 倍以上，搞大模型训练的值得看看。

原文

6月24日

13:13

vLLM@vllm_project

vLLM 项目宣布支持 DFlash 投机解码，用户只需将 EAGLE-3 检查点替换为 DFlash 检查点即可启用，无需修改代码。该功能通过开源 Speculators 库将 DFlash 草案模型与目标模型的隐藏状态连接。在单块 Blackwell Ultra GPU 上运行 Gemma-4 31B 模型，Math500 基准取得 5.8 倍吞吐量提升，GSM8K 提升 5.3 倍，HumanEval 提升 5.6 倍，MBPP 提升 4.4 倍。

AI模型 DFlash vLLM Gemma-4 NVIDIA 推理优化

推荐理由：vLLM 和 NVIDIA 合作推出 DFlash 投机解码，Gemma-4 31B 推理速度提升近 6 倍，配置只需改一行 checkpoint 路径。

原文

03:18

NVIDIA AI@NVIDIAAI

精选

NVIDIA发布DFlash，一种开源轻量级块扩散模型，专为投机解码设计。在NVIDIA Blackwell硬件上，DFlash可实现高达15倍的推理吞吐量提升，同时保持相同的用户交互响应速度。与传统逐token解码不同，DFlash一次生成整个token块，由主模型并行验证。该方案即插即用，已集成到SGLang、TensorRT-LLM和vLLM等框架中。

AI模型 DFlash NVIDIA Blackwell 投机解码开源模型

推荐理由：NVIDIA开源了DFlash，用块扩散投机解码让Blackwell推理提速15倍，还支持SGLang和vLLM，随手就能用。

原文

01:02

LMSYS Org (SGLang)@lmsysorg

79°

与NVIDIA合作，在GB300上使用SGLang服务DeepSeek-V4，实现5倍吞吐量提升（~2,200→~11,200 tok/s/GPU，交互性~50 tok/s/user）。借助MTP，在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍，峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化（MXFP4）且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。

AI模型 DeepSeek-V4 GB300 SGLang 推理优化 NVIDIA

推荐理由：想用SGLang在GB300上榨干DeepSeek-V4？NVIDIA合作实测，吞吐翻5倍，交互延迟不变，MTP和量化细节全公开。

原文

6月23日

17:03

Aravind Srinivas@AravSrinivas

据曼哈顿研究所数据，美国数据中心仅占每日用水量的0.2%。传统冷却系统每MW每年消耗约260万加仑水，而采用45°C液冷技术的AI工厂在适宜气候下可使用干冷却器，将设施冷却水消耗降至接近零。NVIDIA指出，液冷不仅提升水效和能效，还创造了余热回收和社区供暖机会。这一转变颠覆了公众对AI数据中心大量耗水的印象。

行业 NVIDIA 液冷数据中心 AI可持续水消耗

推荐理由：反常识吧？液冷能让AI工厂几乎不耗水，还顺带回收热能, 值得看看数据。

原文

16:58

Julien Chaumond@julien_c

曼哈顿研究所数据显示，美国数据中心用水仅占全美日用水量的0.2%。采用45°C液冷技术后，AI工厂在适宜气候下可用干冷器替代冷却塔，将设施冷却用水从约每年每MW 260万加仑降至接近零。液冷技术同时提升能效，并支持热量回收与社区供暖，使数据中心成为电网资产。

行业 NVIDIA 液冷数据中心能效

推荐理由：NVIDIA用液冷把数据中心用水几乎干到零，还顺便回收热量给社区，环保和算力两不误。

原文

14:06

lmarena.ai@lmarena_ai

NVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11（两个变体），整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。

AI模型 Cosmos-3-Super NVIDIA Text-to-Image Arena 文本到图像开源模型

推荐理由：NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平，想试试免费好用的生成工具可以关注它。

原文

6月20日

03:52

Nous Research@NousResearch

精选

Nous Research联合NVIDIA和Stripe启动Hermes Agent加速商业黑客马拉松，鼓励构建能自主执行商业操作的AI代理。NVIDIA提供NemoClaw安全运行、Nemotron 3 Ultra快速推理及代理技能支持。Stripe新Skills让代理能自主购买服务、订阅SaaS。总奖金包括$17,500现金、3台NVIDIA DGX Spark及$9,000 Stripe Credits。提交截止6月30日。

行业 NVIDIA Stripe Nous Research Hermes Agent 智能体

推荐理由：想让你造的AI代理自己挣钱花钱？这个黑客马拉松有NVIDIA和Stripe支持，奖品有现金和DGX Spark，值得试试。

原文

6月19日

18:42

Together AI@togethercompute

Together AI的James Zou与NVIDIA的Venkat Srinivasan将于7月1日在AI Engineer World's Fair上讨论开放模型如何实现集体智能。该活动聚焦开源模型在协作智能系统中的作用。演讲将结合两家公司的技术实践，分析开放模型对多智能体架构的影响。

行业 Together AI NVIDIA 开放模型 AI Engineer World's Fair

推荐理由：想了解开放模型怎么支撑多智能体协作？Together AI和NVIDIA的人要聊这个，7月1日别错过。

原文

6月17日

23:17

AI Will@FinanceYF5

73°

NVIDIA在SIGGRAPH 2026上发布MotionBricks，该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟，让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计，能动态生成自然动作。

AI模型 MotionBricks NVIDIA 游戏角色机器人动作生成

推荐理由：NVIDIA搞了个MotionBricks，35万种动作技能随便切换，游戏角色和机器人动起来更自然了，比以前的方案快很多。

原文

06:04

NVIDIA AI@NVIDIAAI

73°

NVIDIA Research 推出 SpatialClaw，一个无需训练的智能体，通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块，检查中间结果并跨步骤调整策略。感知输出作为普通变量，可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分，在 6 种不同模型骨干上表现稳定。

AI模型 SpatialClaw NVIDIA 智能体多模态视觉推理

推荐理由：SpatialClaw 不用额外训练，靠写代码搞定复杂视觉任务，在 20 个基准上平均提升 11.2 分，还兼容多种模型。

原文

03:03

berryxia@berryxia

73°

NVIDIA开源了SOMA-X v0.2，一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性，采用Apache 2.0许可证。它专为机器人和物理AI设计，可用于机器人训练、物理仿真和动作迁移，解决了不同机器人体型不统一导致动作数据难以复用的问题。

AI模型 SOMA-X NVIDIA 3D人体模型机器人物理AI

推荐理由：NVIDIA开源了SOMA-X v0.2，单一骨架就能适配不同体型，机器人动作数据复用门槛降低，训练效率提升。

原文

01:58

Jim Fan@jimfan

精选72°

ENPIRE赋予8个Codex智能体机器人集群和GPU资源，自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。

AI产品 ENPIRE Codex NVIDIA 智能体机器人

推荐理由：NVIDIA让8个AI智能体自己控制机器人干活，还能绑扎带装显卡，而且要开源，你可以在家搭机器人实验室了！

原文

01:57

Jim Fan@jimfan

76°

NVIDIA联合CMU和伯克利推出ENPIRE系统，让AI智能体完全自主控制真实机器人循环，包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化，无需人类介入。

AI模型 ENPIRE NVIDIA 机器人智能体自主循环

推荐理由：NVIDIA搞了个ENPIRE，让AI自己操控机器人反复试错，真实任务成功率干到99%，连GPU都能自己插。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

16:34

AI Will@FinanceYF5

83°

NVIDIA 发布了 SANA-Streaming 模型，支持对长达一分钟的视频进行实时编辑。用户可以在视频播放过程中更改服装、背景、风格和场景。该模型无需等待渲染，即可直接看到修改结果。

AI模型 NVIDIA SANA-Streaming 视频生成实时编辑

推荐理由：NVIDIA 出了 SANA-Streaming，放视频时就能实时换衣服换背景，一分钟的长视频也能改

原文

14:23

AlphaSignal@AlphaSignalAI

精选

NVIDIA开源了AI技能安全扫描器SkillSpector。研究发现26.1%的已发布AI技能存在漏洞，36%包含提示注入向量。SkillSpector无需扫描恶意代码即可检测危险特性，帮助开发者避免在安装未扫描技能时的常见风险。该工具专为检查AI技能潜在安全问题设计，可集成到开发流程中。

AI产品 NVIDIA SkillSpector AI安全提示注入开源工具

推荐理由：NVIDIA开源了SkillSpector，专门扫描AI技能的漏洞和提示注入。别像99%的开发者那样不检查就直接装，先扫一下再安心用。

原文

6月13日

13:12

MiniMax_AI@MiniMax_AI

MiniMax 宣布其 M3 模型端点获得 NVIDIA 官方认可，并已上线免费 GPU 加速版本。用户现在可以免费体验基于 NVIDIA GPU 加速的 M3 模型推理服务。该端点支持高性能计算，适用于多种 AI 任务。

AI产品 MiniMax M3 NVIDIA GPU加速

推荐理由：MiniMax 的 M3 模型免费加速了

原文

11:20

AI Will@FinanceYF5

Lilly、Novartis和J&J与Isomorphic Labs达成合作，投入数十亿美元用于AI设计的药物。Lilly还与NVIDIA启动了一项AI药物发现计划。Synaptic Data梳理了AI药物发现技术栈8层上的110+家初创公司。

行业 Isomorphic Labs Lilly Novartis J&J NVIDIA AI药物发现

推荐理由：三大药企联手AI公司砸钱

原文

11:05

lmarena.ai@lmarena_ai

精选

NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名，在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出，但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽，排名仍在稳定中。

AI模型 Nemotron 3 Ultra NVIDIA Agent Arena 开源模型智能体

推荐理由：NVIDIA 开源模型在智能体评测中排第5

原文

09:55

rohanpaul_ai@rohanpaul_ai

精选73°

NVIDIA 发布了首个智能体 AI 基准测试 AgentPerf 的结果。该基准由 Artificial Analysis 推出，测试系统在保持响应性的同时能并发运行多少个智能体。GB300 NVL72 在最低服务层级达到每兆瓦 61.4K 并发智能体，而 H200 仅为 2.6K，性能提升约 23.6 倍。测试模拟了真实编码智能体路径，涵盖 12 种以上编程语言，请求长度从 5K 到 131K token 不等，平均约 27K token。性能提升得益于 72 块 GPU 通过 NVLink 组成机架级系统，以及优化 MoE 专家分配、通信与计算重叠等软件技术。

AI模型 NVIDIA GB300 NVL72 H200 AgentPerf 智能体

推荐理由：NVIDIA 首个智能体基准，GB300 比 H200 强 23 倍

原文

6月12日

13:34

Thinking Machines Lab@thinkymachines

83°

Think Machines 宣布与 NVIDIA 合作，利用其硬件和平台来训练前沿模型，并提供可定制的 AI 解决方案。这一合作将加速模型训练效率，降低开发门槛，使企业能够更灵活地部署定制化 AI。NVIDIA 的算力支持将帮助 Think Machines 在竞争激烈的 AI 市场中提升模型性能。

行业 NVIDIA Think Machines 模型训练 AI 定制合作

推荐理由：NVIDIA 与 Think Machines 的合作意味着更强大的算力支持，做模型训练和定制 AI 的团队可以关注这一进展，看看能否利用其平台加速自己的项目。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:50

Artificial Analysis@ArtificialAnlys

精选

随着用户和企业赋予 AI 模型和智能体更多自主权，筛选其输入输出的护栏变得至关重要。然而，现有的护栏评测基准未能跟上模型智能的发展速度。与 NVIDIA 合作，该团队在三个开放数据集上独立评测了护栏与审核模型，衡量了检测质量、延迟以及捕捉不安全内容与过度拒绝安全内容之间的权衡。结果显示，没有模型能全面胜出，且缺乏统一的评判标准。这被视为一个测量问题的早期步骤，随着模型承担更多实际工作，该问题将愈发重要。

行业 AI 安全护栏评测 NVIDIA 模型审核智能体

推荐理由：AI 安全护栏评测标准滞后，做模型部署和安全审核的团队需要关注这个评测缺口，建议点开了解当前护栏模型的真实表现。

原文

12:42

Sebastian Raschka@rasbt

精选

Nemotron 3 Ultra 是 NVIDIA 发布的新一代开源权重模型，延续了前代 Super 变体的 Mamba-2 注意力混合架构和 LatentMoE 设计，但规模更大。该模型在能力与效率之间取得了极佳平衡，性能表现令人印象深刻。开源权重意味着开发者可以自由下载、微调和部署，适合资源受限但追求高性能的场景。这一发布进一步丰富了开源大模型生态，为研究者和工程师提供了新的选择。

AI模型 Nemotron 3 Ultra Mamba-2 LatentMoE 开源/仓库 NVIDIA

推荐理由：NVIDIA 把 Mamba-2 混合架构和 LatentMoE 做到更大更强，追求高性价比模型的团队可以直接拿来用，省去从头训练的昂贵成本。

原文

12:31

karminski-牙医 (AI工具)@karminski3

精选

Google发布了Gemma小模型的Diffusion版本，名为Diffusion Gemma，大小26B但激活参数量仅4B。与NVIDIA合作针对RTX 4090和5090优化，5090上每秒可生成700+ token。Diffusion模型像刮奖一样逐片生成文本，速度远快于传统逐字生成模型，但输出质量略低。在AIME 2026数学测试中达到Gemma4-26B-A4B的94%水平，在Agent能力测试中达到82%。4bit量化版本仅需16G显存即可运行。

AI模型 Diffusion模型 Gemma Google NVIDIA 推理加速

推荐理由：Diffusion Gemma把文本生成速度拉到单卡700TPS，做实时对话或高吞吐推理的团队可以直接用，4bit量化16G显存就能跑，值得试试能否做投机解码的草稿模型。

原文

12:29

Mira Murati (TML)@miramurati

前 OpenAI CTO Mira Murati 在 X 上发文感谢 NVIDIA CEO Jensen Huang 及其团队的支持，宣布双方合作部署至少 1GW 的 Vera Rubin 系统。该系统旨在将可适应的协作 AI 带给每个人，标志着 AI 基础设施的大规模扩展。Vera Rubin 是 NVIDIA 下一代 AI 计算平台，此次合作将显著提升 AI 训练和推理能力。

行业 NVIDIA Vera Rubin AI 基础设施合作 Mira Murati

推荐理由：AI 基础设施的规模化部署是行业关键瓶颈，关注算力布局的团队和开发者值得了解这一合作动向。

原文

07:02

NVIDIA AI@NVIDIAAI

NVIDIA 宣布将参加 2026 年在洛杉矶举办的 SIGGRAPH 大会，展示神经渲染、世界模型、物理 AI 等前沿技术，并提供动手实验室。SIGGRAPH 是计算机图形学与交互技术领域的顶级会议，NVIDIA 的参与意味着其最新图形与 AI 研究成果将集中亮相。对于图形开发者、AI 研究者和游戏行业从业者来说，这是了解下一代渲染与仿真技术的重要窗口。

行业 NVIDIA SIGGRAPH 2026 神经渲染物理 AI 世界模型

推荐理由：NVIDIA 把 SIGGRAPH 当作技术风向标，做图形渲染、物理仿真或 AI 模型的团队值得关注，可以提前规划参会或跟进后续发布。

原文

06:16

NVIDIA AI@NVIDIAAI

精选

NVIDIA Research发布开放模型MotionBricks，基于35万+运动片段实现每秒15,000帧的实时角色动画。该模型无需手工制作过渡或微调，可直接用于角色动画，并支持机器人应用。相关论文将发表于SIGGRAPH 2026，代码和演示已开源。

AI模型 MotionBricks NVIDIA 角色动画实时机器人

推荐理由：NVIDIA开源实时动画，35万片段15K FPS

原文

04:41

NVIDIA AI@NVIDIAAI

NVIDIA 发布 Nemotron 3 模型，采用混合 Mamba Transformer 架构，通过 Mamba-2 降低注意力机制开销，实现亚二次复杂度。潜在 MoE 通过降维投影减少 HBM 与 SRAM 间的数据移动，并增加专家数量以提升稀疏性效率。多 token 预测（MTP）使模型在训练时能预见未来 token，推理时可用于推测解码。模型采用新的 OpenMDW 1.1 许可证。

AI模型 Nemotron 3 混合 Mamba Transformer 潜在 MoE 多 token 预测 NVIDIA

推荐理由：Nemotron 3 的架构创新直击大模型推理效率瓶颈，做模型优化和部署的开发者值得关注其混合 Mamba 和潜在 MoE 的具体实现，可以直接参考其设计思路。

原文

04:04

Together AI@togethercompute

精选

Trajectory Labs 在 Together Compute 和 NVIDIA 的支持下，仅用不到 24 小时就在一个开放模型上实现了前沿模型级别的性能。这展示了当优秀开源模型与合适的训练基础设施结合时，可以快速取得显著成果。Together Compute 为此提供了算力支持，凸显了开放模型生态的潜力。

AI模型开放模型后训练算力基础设施 Together Compute NVIDIA

推荐理由：对于关注开源模型训练效率的团队，这个案例证明了 24 小时内就能让开放模型达到前沿水平，值得研究其训练流程。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？