03:09marktechpost@Asif Razzaq精选NVIDIA 开源了 BioNeMo Agent Toolkit,将 OpenFold3、DiffDock 和 GenMol 等生物分子模型包装为 AI 代理可直接调用的技能。每个技能包含模型用途、输入、输出和失败模式说明。在 NVIDIA 使用 Codex CLI 和 GPT-5.5 fast 的基准测试中,该工具将任务完成率从 57.1% 提升至 100%,并实现 token 效率翻倍。AI产品NVIDIABioNeMo Agent ToolkitOpenFold3DiffDock药物发现3 个信源在谈推荐理由:NVIDIA 开源了这个工具,让 AI 代理能直接调用分子模型做药物发现。用上它任务完成率翻倍还省 Token,做生物计算的同学可以试试。原文
18:57vLLM@vllm_project精选NVIDIA 与 vLLM 合作发布 step-by-step 指南,教你用四台 DGX Spark 盒子组建私有集群,自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器,可提供兼容 OpenAI 的端点。无需数据中心,适合构建私有 agent 工作流。技巧Nemotron-3-UltraNVIDIADGX SparkvLLM自托管4 个信源在谈推荐理由:想不依赖数据中心自己跑 550B 模型?NVIDIA 出了详细教程,四台 DGX Spark 就能拼出 OpenAI 兼容的端点。原文
13:50阿里云 Alibaba Cloud@alibaba_cloud在Flink Forward Asia Shenzhen 2026上,NVIDIA的Chuan Chen介绍了与阿里云的技术合作。双方通过CUDA库加速Apache Flink的多模态数据流处理。这一开源协作实现了端到端高性能多模态流式架构,适用于AI评论、实时图文流和交互式问答。行业NVIDIAAlibaba CloudApache FlinkCUDA多模态5 个信源在谈推荐理由:NVIDIA和阿里云用CUDA把Flink的多模态数据处理速度拉满了,想做实时AI评论或图文问答的可以看看这个架构。原文
09:39IT之家(博客/媒体)精选78°澳大利亚云服务商 Firmus 宣布在印尼峇淡建设一座 360MW 的 AI 工厂,采用 NVIDIA DSX 液冷方案。该工厂由 Firmus 与 DayOne 合作开发,电力容量达 360MW。根据与 NVIDIA 至 2034 年的战略合作,NVIDIA 将在明后两年交付 Grace Blackwell、Vera Rubin、Vera 等多代算力硬件,总计 17 万颗 GPU。Firmus 预计前六年从已承诺承购协议中获得 250~300 亿美元收入。NVIDIA 还是 Firmus 今年四月股权融资的有条件参与方。行业NVIDIAFirmusAI工厂Grace BlackwellVera Rubin6 个信源在谈推荐理由:想了解超大规模 AI 数据中心怎么建?Firmus 联手 NVIDIA 在印尼搞了个 360MW 的大项目,17 万颗 GPU,仅硬件收入就有 300 亿美元,值得一读。原文
22:27NVIDIA AI@NVIDIAAINVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon,要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理,以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits,第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits,第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日(周二)前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。行业NVIDIAStripeNous ResearchHermes AgentDGX Spark智能体黑客松6 个信源在谈推荐理由:想赢一台 DGX Spark 吗?用 Hermes Agent 造个自动赚钱的 AI 公司,前三名都有现金加硬件,截止 6 月 30 日,快上车。原文
21:12LMSYS Org (SGLang)@lmsysorg精选英伟达与智谱AI合作,发布了基于GLM-5.2的NVFP4量化检查点。该模型为744B参数混合专家架构(40B活跃参数),专注于推理和编码任务。NVFP4量化通过NVIDIA Model Optimizer实现,在降低内存占用的同时保持前沿推理性能。模型还支持稀疏注意力和IndexShare索引器,实现高效长上下文处理。目前已在Blackwell/Grace Blackwell上通过SGLang提供首日支持。AI模型GLM-5.2NVFP4NVIDIASGLang推理模型5 个信源在谈推荐理由:英伟达把GLM-5.2压缩成NVFP4,内存省一大截,推理编码在Blackwell上直接跑,SGLang第一时间就能用。原文
13:54vLLM@vllm_project精选NVIDIA发布GLM-5.2的NVFP4检查点,在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行:vllm serve nvidia/GLM-5.2-NVFP4。AI模型GLM-5.2NVFP4vLLMNVIDIA推理模型4 个信源在谈推荐理由:想省显存又不想降精度?GLM-5.2的NVFP4版在vLLM上线了,比FP8省一半内存,推理编码长文本都稳。原文
11:39marktechpost@Sana Hassan精选本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集,无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。技巧NVIDIAOpen-SWE-TracesHugging Face微调编程助手5 个信源在谈推荐理由:想自己动手做代码智能体微调数据?这教程手把手教你解析NVIDIA开源的Open-SWE-Traces,连Token预算和工具使用指标都算好了。原文
16:55Geek@geekbb精选NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。AI模型nvidia/GLM-5.2-NVFP4智谱NVIDIAHugging Face推理模型4 个信源在谈推荐理由:NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度,放 Hugging Face 上免费调,还能白嫖,日常推理够用了。原文
10:10NVIDIA AI@NVIDIAAI精选NVIDIA与Linux基金会及行业伙伴共同启动Akrites计划,旨在应对AI驱动的开源软件安全威胁。NVIDIA首席安全官David Reber强调透明与开放协作对AI时代安全至关重要。Akrites将建立共享安全事件响应团队(SIRT)和标准化保密披露流程,在漏洞被利用前进行上游修复。该计划特别针对AI可在数分钟内发现软件漏洞的新挑战。行业NVIDIALinux基金会AkritesAI安全开源安全6 个信源在谈推荐理由:NVIDIA和Linux基金会牵头搞了个Akrites,专门对付AI快速找漏洞的问题,还建了共享安全响应团队,挺实在的。原文
05:57a16z@a16z76°AI 初创公司 Mirendil 宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 共同领投,NVIDIA 等参投。公司由 Behnam Neyshabur 联合创立,团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 提出“自加速 AI”概念,让 AI 像科学家一样在特定领域积累深度专业知识,从而加速自身研发进程,并计划将这一能力开放给更多科研机构和企业。行业Mirendila16zNVIDIA融资自加速 AI10 个信源在谈推荐理由:Mirendil 刚融了 2 亿美元,要造能自己加速研发的 AI,团队全是前沿机构出来的,想法挺前沿。原文
04:57Marc Andreessen@pmarca73°新创公司 Mirendil AI 今日宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 领投,NVIDIA 跟投。公司由 Behnam Neyshabur 等四位联合创始人领导,核心团队共 20 名研究者与工程师,来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 定位于构建自加速 AI 研发系统,目标是通过 AI 推动科学进步,并主张让更多实验室自主控制 AI 基础设施。行业Mirendila16zKleiner PerkinsNVIDIA融资10 个信源在谈推荐理由:a16z 和 Kleiner Perkins 联手投了两亿美元,团队全是大厂顶尖人才,就是要搞AI自己加快研究速度的路子,跟传统实验室玩法不同。原文
04:21a16z@a16z81°Mirendil AI 完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 联合领投,NVIDIA 参与投资。该公司正构建一个专精 AI 研发的自主系统,类似为研究设计的编码智能体,可自行控制 GPU 并循环执行科研与工程任务。创始团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。行业Mirendila16zNVIDIA融资自主AI研究10 个信源在谈推荐理由:Mirendil 要做让 AI 自己搞 AI 研发的系统,2 亿美元种子轮,团队来自顶尖实验室,目标是打破大厂垄断。原文
03:27NVIDIA AI@NVIDIAAI精选NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3,允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能,如搜索、摘要、警报、报告和片段审查。提供统一开源仓库,附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告,集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别,并取得 SOTA 性能。AI模型NVIDIAMetropolisVSS 3视频搜索智能体7 个信源在谈推荐理由:NVIDIA 刚发了 VSS 3,你的编程代理现在能用一句话搜索、总结视频了,新增16种技能和3D追踪,比以前好用得多。原文
01:12NVIDIA AI@NVIDIAAI76°NVIDIA 发布了 NeMo AutoModel,基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核,仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分,专为大规模模型构建设计。AI产品NeMo AutoModelMoEHugging Face Transformers v5训练加速NVIDIA7 个信源在谈推荐理由:NVIDIA 出了个 NeMo AutoModel,基于 Hugging Face Transformers v5,几行代码就能给 MoE 模型训练加速 3 倍以上,搞大模型训练的值得看看。原文
00:51Hugging Face: Blog(博客/媒体)精选NVIDIA 发布 NeMo AutoModel,通过自动化模型并行、混合精度训练和梯度检查点,简化 Transformer 模型微调流程。该工具可自动检测硬件配置,支持多 GPU 分布式训练,无需手动调整参数。在微调 BERT-base 模型时,相比标准 PyTorch 实现,NeMo AutoModel 将训练时间缩短约 40%,并保持相同精度。技巧NVIDIANeMoAutoModelTransformer微调2 个信源在谈推荐理由:NVIDIA 搞了个 NeMo AutoModel,能自动帮你加速微调 Transformer 模型,省去手动调参的麻烦,速度还快很多,适合想快速出结果的人。原文
13:13vLLM@vllm_projectvLLM 项目宣布支持 DFlash 投机解码,用户只需将 EAGLE-3 检查点替换为 DFlash 检查点即可启用,无需修改代码。该功能通过开源 Speculators 库将 DFlash 草案模型与目标模型的隐藏状态连接。在单块 Blackwell Ultra GPU 上运行 Gemma-4 31B 模型,Math500 基准取得 5.8 倍吞吐量提升,GSM8K 提升 5.3 倍,HumanEval 提升 5.6 倍,MBPP 提升 4.4 倍。AI模型DFlashvLLMGemma-4NVIDIA推理优化10 个信源在谈推荐理由:vLLM 和 NVIDIA 合作推出 DFlash 投机解码,Gemma-4 31B 推理速度提升近 6 倍,配置只需改一行 checkpoint 路径。原文
09:58Pandaily@contact@pandaily.com (Pandaily)NVIDIA、高通等芯片巨头正在加码具身AI芯片赛道。多家公司发布了针对人形机器人等应用的专用芯片方案。市场争夺日趋白热化,各厂商正通过差异化设计和生态合作抢占先机。行业NVIDIAQualcomm具身智能芯片市场动态8 个信源在谈推荐理由:NVIDIA和高通都在押注具身AI芯片,看看他们谁能笑到最后。原文
03:18NVIDIA AI@NVIDIAAI精选NVIDIA发布DFlash,一种开源轻量级块扩散模型,专为投机解码设计。在NVIDIA Blackwell硬件上,DFlash可实现高达15倍的推理吞吐量提升,同时保持相同的用户交互响应速度。与传统逐token解码不同,DFlash一次生成整个token块,由主模型并行验证。该方案即插即用,已集成到SGLang、TensorRT-LLM和vLLM等框架中。AI模型DFlashNVIDIABlackwell投机解码开源模型8 个信源在谈推荐理由:NVIDIA开源了DFlash,用块扩散投机解码让Blackwell推理提速15倍,还支持SGLang和vLLM,随手就能用。原文
01:02LMSYS Org (SGLang)@lmsysorg79°与NVIDIA合作,在GB300上使用SGLang服务DeepSeek-V4,实现5倍吞吐量提升(~2,200→~11,200 tok/s/GPU,交互性~50 tok/s/user)。借助MTP,在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍,峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化(MXFP4)且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。AI模型DeepSeek-V4GB300SGLang推理优化NVIDIA8 个信源在谈推荐理由:想用SGLang在GB300上榨干DeepSeek-V4?NVIDIA合作实测,吞吐翻5倍,交互延迟不变,MTP和量化细节全公开。原文
17:03Aravind Srinivas@AravSrinivas据曼哈顿研究所数据,美国数据中心仅占每日用水量的0.2%。传统冷却系统每MW每年消耗约260万加仑水,而采用45°C液冷技术的AI工厂在适宜气候下可使用干冷却器,将设施冷却水消耗降至接近零。NVIDIA指出,液冷不仅提升水效和能效,还创造了余热回收和社区供暖机会。这一转变颠覆了公众对AI数据中心大量耗水的印象。行业NVIDIA液冷数据中心AI可持续水消耗7 个信源在谈推荐理由:反常识吧?液冷能让AI工厂几乎不耗水,还顺带回收热能, 值得看看数据。原文
16:58Julien Chaumond@julien_c曼哈顿研究所数据显示,美国数据中心用水仅占全美日用水量的0.2%。采用45°C液冷技术后,AI工厂在适宜气候下可用干冷器替代冷却塔,将设施冷却用水从约每年每MW 260万加仑降至接近零。液冷技术同时提升能效,并支持热量回收与社区供暖,使数据中心成为电网资产。行业NVIDIA液冷数据中心能效7 个信源在谈推荐理由:NVIDIA用液冷把数据中心用水几乎干到零,还顺便回收热量给社区,环保和算力两不误。原文
15:58IT之家(博客/媒体)Valve 发布了 SteamOS 3.8 版本,但目前仅支持 AMD 的 GPU。Valve 员工 Pierre-Loup Griffais 在接受 The Verge 采访时透露,团队正在为 SteamOS 开发 NVIDIA 显卡驱动程序支持,并与 NVIDIA 密切合作。虽然该支持可能不会在今年推出,但 Valve 已将其列为幕后重点方向。行业ValveSteamOSNVIDIA显卡兼容Linux游戏7 个信源在谈推荐理由:Valve 官方确认 SteamOS 正在开发 N 卡支持,虽然今年可能出不来,但这是 Linux 游戏平台的关键一步。原文
14:06lmarena.ai@lmarena_aiNVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11(两个变体),整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。AI模型Cosmos-3-SuperNVIDIAText-to-Image Arena文本到图像开源模型6 个信源在谈推荐理由:NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平,想试试免费好用的生成工具可以关注它。原文
13:13arXiv cs.AI@Prateek Agnihotri, Sanchit Jain, Prabhat Agnihotri, Aditya Prasad, Shubham Jain这篇论文介绍了在NVIDIA Nemotron Model Reasoning Challenge中解决Bit Manipulation Puzzles的创新算法。该任务要求发现隐藏的逻辑规则并应用于新输入,但LLMs通常因复杂布尔逻辑模拟而幻觉。作者提出放弃算术逻辑,转而使用字符串相似性、结构化搜索和自主错误恢复。他们将逻辑门推导重构为基选择任务,利用最小比特翻转来隔离基并推导真值表,无需复杂算术。通过回溯DFS和错误恢复,结合比特分词和交互推理SFT,该方法在验证集上达到96%以上的准确率,最终获得比赛第7名。论文NVIDIANemotronBit Manipulation Puzzles推理模型LLM推荐理由:这篇论文用字符串相似度和回溯搜索替代了算术逻辑,让LLM在位操作谜题上验证精度超过96%,比赛第7名,方法很巧妙。原文
10:23Pandaily@contact@pandaily.com (Pandaily)72°Intel的CPU复苏、Broadcom的定制ASIC扩张以及云巨头自研芯片正重塑AI算力格局。这些挑战者试图从不同角度分食NVIDIA在AI训练和推理市场的份额。具体包括Intel的Xeon处理器提升AI性能,Broadcom为谷歌等客户设计的TPU持续迭代,以及亚马逊Trainium、谷歌TPU等云自研芯片逐步规模化。行业NVIDIAIntelBroadcomAI芯片算力竞争8 个信源在谈推荐理由:Intel、Broadcom和云巨头都在动NVIDIA的蛋糕,这篇梳理了各家具体动作,让你看清AI芯片战局。原文
09:48IT之家(博客/媒体)76°NVIDIA 宣布 Vera Rubin NVL4 平台将于 2026Q4 上市。该平台集成 4 颗 Rubin GPU 和 2 颗 Vera CPU,采用第六代 NVLink 协议和 NVLink-C2C 互连。与 Grace Hopper 相比,其科学计算模拟性能提升 4 倍,科学 AI 训练性能提升 6 倍,科学 AI 推理性能提升 8 倍。系统兼容液冷 NVIDIA MGX 模块化服务器,专为现代超级计算优化。AI产品NVIDIAVera RubinNVL4Grace Hopper超级计算4 个信源在谈推荐理由:NVIDIA 发了 Vera Rubin NVL4,2026 年底上市,科学计算比 Grace Hopper 快 4 倍,AI 训练快 6 倍,搞超算和 AI 的可以盯一下。原文
10:23IT之家(博客/媒体)鸿海董事长刘扬伟6月18日在台湾地区工商协进会会员大会上表示,基于NVIDIA Vera Rubin平台打造1GW规模的AI数据中心需要470亿美元资本支出。单一个Vera Rubin机架价格为910万美元,1GW数据中心共需约3557个各类机架。每年电力支出达13亿美元,硬件折旧费用为电力成本的六倍。刘扬伟援引外部数据预测,全球数据中心产业规模到2030年将达1.6万亿美元,电力容量将从2024年的68GW增至174GW。行业Vera RubinNVIDIA英伟达数据中心资本支出5 个信源在谈推荐理由:刘扬伟算了笔账:建1GW的Vera Rubin数据中心要470亿美元,单机柜910万,电费一年13亿。想了解AI数据中心的真实成本?看这篇。原文
06:57marktechpost@Asif RazzaqNVIDIA AI推出了SpatialClaw,这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行,将代码作为动作接口。SpatialClaw能够组合多种感知工具,实现3D空间推理。这种设计免去了传统微调或训练步骤。AI模型SpatialClawNVIDIAPython智能体3D空间推理2 个信源在谈推荐理由:NVIDIA搞了个叫SpatialClaw的智能体,不用训练,直接用写Python代码的方式做3D空间推理,挺创新的。原文
03:52Nous Research@NousResearch精选Nous Research联合NVIDIA和Stripe启动Hermes Agent加速商业黑客马拉松,鼓励构建能自主执行商业操作的AI代理。NVIDIA提供NemoClaw安全运行、Nemotron 3 Ultra快速推理及代理技能支持。Stripe新Skills让代理能自主购买服务、订阅SaaS。总奖金包括$17,500现金、3台NVIDIA DGX Spark及$9,000 Stripe Credits。提交截止6月30日。行业NVIDIAStripeNous ResearchHermes Agent智能体4 个信源在谈推荐理由:想让你造的AI代理自己挣钱花钱?这个黑客马拉松有NVIDIA和Stripe支持,奖品有现金和DGX Spark,值得试试。原文
18:42Together AI@togethercomputeTogether AI的James Zou与NVIDIA的Venkat Srinivasan将于7月1日在AI Engineer World's Fair上讨论开放模型如何实现集体智能。该活动聚焦开源模型在协作智能系统中的作用。演讲将结合两家公司的技术实践,分析开放模型对多智能体架构的影响。行业Together AINVIDIA开放模型AI Engineer World's Fair6 个信源在谈推荐理由:想了解开放模型怎么支撑多智能体协作?Together AI和NVIDIA的人要聊这个,7月1日别错过。原文
18:19pandaily@contact@pandaily.com (Pandaily)73°Coherent、Nokia、JX Advanced Metals 等全球光芯片厂商宣布扩大产能,以满足AI数据中心对高速互联的需求。NVIDIA 为此投资20亿美元,锁定光子互连供应链。这些扩产计划预计在2026年前完成,以支撑下一代AI网络架构。行业CoherentNokiaJX Advanced MetalsNVIDIA光芯片AI数据中心4 个信源在谈推荐理由:光芯片是AI数据中心的血管,英伟达砸20亿锁定供应,可以了解一下三巨头各自的扩产计划原文
09:39marktechpost@Sana Hassan精选本教程演示如何使用 NVIDIA SkillSpector 对 AI 技能进行安全风险预部署扫描。通过构建良性和故意含漏洞的技能语料库,利用 SkillSpector 的 LangGraph 工作流进行扫描,并用 pandas 整理风险评分与发现。结果导出为 SARIF 格式,支持自定义分析器和可选的 LLM 语义分析。该流程覆盖静态分析、风险分类可视化及报告生成。技巧NVIDIASkillSpectorSARIFAI安全静态分析1 个信源在谈推荐理由:NVIDIA 教你用 SkillSpector 做 AI 技能安全扫描,从写语料到出 SARIF 报告,一步一步都有代码,适合想加固 AI 应用的开发者。原文
23:17AI Will@FinanceYF573°NVIDIA在SIGGRAPH 2026上发布MotionBricks,该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟,让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计,能动态生成自然动作。AI模型MotionBricksNVIDIA游戏角色机器人动作生成7 个信源在谈推荐理由:NVIDIA搞了个MotionBricks,35万种动作技能随便切换,游戏角色和机器人动起来更自然了,比以前的方案快很多。原文
07:25IT之家(博客/媒体)83°英伟达在MLPerf Training 6.0七项基准测试中全部夺魁,Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统,在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载,刷新了大规模训练效率纪录。AI模型NVIDIABlackwellDeepSeek-V3MLPerf训练基准9 个信源在谈推荐理由:英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟,比上代快60%,性能真狠。原文
06:04NVIDIA AI@NVIDIAAI73°NVIDIA Research 推出 SpatialClaw,一个无需训练的智能体,通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块,检查中间结果并跨步骤调整策略。感知输出作为普通变量,可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分,在 6 种不同模型骨干上表现稳定。AI模型SpatialClawNVIDIA智能体多模态视觉推理8 个信源在谈推荐理由:SpatialClaw 不用额外训练,靠写代码搞定复杂视觉任务,在 20 个基准上平均提升 11.2 分,还兼容多种模型。原文
03:03berryxia@berryxia73°NVIDIA开源了SOMA-X v0.2,一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性,采用Apache 2.0许可证。它专为机器人和物理AI设计,可用于机器人训练、物理仿真和动作迁移,解决了不同机器人体型不统一导致动作数据难以复用的问题。AI模型SOMA-XNVIDIA3D人体模型机器人物理AI10 个信源在谈推荐理由:NVIDIA开源了SOMA-X v0.2,单一骨架就能适配不同体型,机器人动作数据复用门槛降低,训练效率提升。原文
01:58Jim Fan@jimfan精选72°ENPIRE赋予8个Codex智能体机器人集群和GPU资源,自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。AI产品ENPIRECodexNVIDIA智能体机器人10 个信源在谈推荐理由:NVIDIA让8个AI智能体自己控制机器人干活,还能绑扎带装显卡,而且要开源,你可以在家搭机器人实验室了!原文
01:57Jim Fan@jimfan76°NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。AI模型ENPIRENVIDIA机器人智能体自主循环8 个信源在谈推荐理由:NVIDIA搞了个ENPIRE,让AI自己操控机器人反复试错,真实任务成功率干到99%,连GPU都能自己插。原文
16:34AI Will@FinanceYF583°NVIDIA 发布了 SANA-Streaming 模型,支持对长达一分钟的视频进行实时编辑。用户可以在视频播放过程中更改服装、背景、风格和场景。该模型无需等待渲染,即可直接看到修改结果。AI模型NVIDIASANA-Streaming视频生成实时编辑8 个信源在谈推荐理由:NVIDIA 出了 SANA-Streaming,放视频时就能实时换衣服换背景,一分钟的长视频也能改原文