18:57vLLM@vllm_project精选NVIDIA 与 vLLM 合作发布 step-by-step 指南,教你用四台 DGX Spark 盒子组建私有集群,自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器,可提供兼容 OpenAI 的端点。无需数据中心,适合构建私有 agent 工作流。技巧Nemotron-3-UltraNVIDIADGX SparkvLLM自托管4 个信源在谈推荐理由:想不依赖数据中心自己跑 550B 模型?NVIDIA 出了详细教程,四台 DGX Spark 就能拼出 OpenAI 兼容的端点。原文
13:50阿里云 Alibaba Cloud@alibaba_cloud在Flink Forward Asia Shenzhen 2026上,NVIDIA的Chuan Chen介绍了与阿里云的技术合作。双方通过CUDA库加速Apache Flink的多模态数据流处理。这一开源协作实现了端到端高性能多模态流式架构,适用于AI评论、实时图文流和交互式问答。行业NVIDIAAlibaba CloudApache FlinkCUDA多模态5 个信源在谈推荐理由:NVIDIA和阿里云用CUDA把Flink的多模态数据处理速度拉满了,想做实时AI评论或图文问答的可以看看这个架构。原文
22:27NVIDIA AI@NVIDIAAINVIDIA、Stripe 与 Nous Research 联合举办 The Hermes Agent Accelerated Business Hackathon,要求开发者用 Hermes Agent 构建能赚钱、花钱、运营业务的智能体。比赛使用 NVIDIA NemoClaw 安全运行、Nemotron 3 Ultra 快速推理,以及 Stripe Skills 实现支付和资源采购。奖品包括第一名 $10,000 现金 + DGX Spark + $5,000 Stripe Credits,第二名 $5,000 现金 + DGX Spark + $3,000 Stripe Credits,第三名 $2,500 现金 + DGX Spark + $1,000 Stripe Credits。参赛者需在 6 月 30 日(周二)前提交 1-3 分钟 demo 视频和简短说明至 Discord 及表单。行业NVIDIAStripeNous ResearchHermes AgentDGX Spark智能体黑客松6 个信源在谈推荐理由:想赢一台 DGX Spark 吗?用 Hermes Agent 造个自动赚钱的 AI 公司,前三名都有现金加硬件,截止 6 月 30 日,快上车。原文
21:12LMSYS Org (SGLang)@lmsysorg精选英伟达与智谱AI合作,发布了基于GLM-5.2的NVFP4量化检查点。该模型为744B参数混合专家架构(40B活跃参数),专注于推理和编码任务。NVFP4量化通过NVIDIA Model Optimizer实现,在降低内存占用的同时保持前沿推理性能。模型还支持稀疏注意力和IndexShare索引器,实现高效长上下文处理。目前已在Blackwell/Grace Blackwell上通过SGLang提供首日支持。AI模型GLM-5.2NVFP4NVIDIASGLang推理模型5 个信源在谈推荐理由:英伟达把GLM-5.2压缩成NVFP4,内存省一大截,推理编码在Blackwell上直接跑,SGLang第一时间就能用。原文
13:54vLLM@vllm_project精选NVIDIA发布GLM-5.2的NVFP4检查点,在Blackwell GPU上相比FP8内存占用降低一半。该模型在推理、编码和长上下文基准测试中保持与FP8相同的准确率。用户可通过vLLM直接加载运行:vllm serve nvidia/GLM-5.2-NVFP4。AI模型GLM-5.2NVFP4vLLMNVIDIA推理模型4 个信源在谈推荐理由:想省显存又不想降精度?GLM-5.2的NVFP4版在vLLM上线了,比FP8省一半内存,推理编码长文本都稳。原文
16:55Geek@geekbb精选NVIDIA 基于智谱 GLM-5.2 模型量化出 NVFP4 精度版本,命名为 nvidia/GLM-5.2-NVFP4。该模型通过 Hugging Face 免费层级 API 提供,限制为每小时 300 次或每天 1,000 次请求。作者认为其性能至少应优于 deepseek-v4-flash。AI模型nvidia/GLM-5.2-NVFP4智谱NVIDIAHugging Face推理模型4 个信源在谈推荐理由:NVIDIA 把智谱的 GLM-5.2 量化成 NVFP4 精度,放 Hugging Face 上免费调,还能白嫖,日常推理够用了。原文
10:10NVIDIA AI@NVIDIAAI精选NVIDIA与Linux基金会及行业伙伴共同启动Akrites计划,旨在应对AI驱动的开源软件安全威胁。NVIDIA首席安全官David Reber强调透明与开放协作对AI时代安全至关重要。Akrites将建立共享安全事件响应团队(SIRT)和标准化保密披露流程,在漏洞被利用前进行上游修复。该计划特别针对AI可在数分钟内发现软件漏洞的新挑战。行业NVIDIALinux基金会AkritesAI安全开源安全6 个信源在谈推荐理由:NVIDIA和Linux基金会牵头搞了个Akrites,专门对付AI快速找漏洞的问题,还建了共享安全响应团队,挺实在的。原文
05:57a16z@a16z76°AI 初创公司 Mirendil 宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 共同领投,NVIDIA 等参投。公司由 Behnam Neyshabur 联合创立,团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 提出“自加速 AI”概念,让 AI 像科学家一样在特定领域积累深度专业知识,从而加速自身研发进程,并计划将这一能力开放给更多科研机构和企业。行业Mirendila16zNVIDIA融资自加速 AI10 个信源在谈推荐理由:Mirendil 刚融了 2 亿美元,要造能自己加速研发的 AI,团队全是前沿机构出来的,想法挺前沿。原文
04:57Marc Andreessen@pmarca73°新创公司 Mirendil AI 今日宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 领投,NVIDIA 跟投。公司由 Behnam Neyshabur 等四位联合创始人领导,核心团队共 20 名研究者与工程师,来自 Anthropic、xAI、Google DeepMind 和 OpenAI。Mirendil 定位于构建自加速 AI 研发系统,目标是通过 AI 推动科学进步,并主张让更多实验室自主控制 AI 基础设施。行业Mirendila16zKleiner PerkinsNVIDIA融资10 个信源在谈推荐理由:a16z 和 Kleiner Perkins 联手投了两亿美元,团队全是大厂顶尖人才,就是要搞AI自己加快研究速度的路子,跟传统实验室玩法不同。原文
04:21a16z@a16z81°Mirendil AI 完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 联合领投,NVIDIA 参与投资。该公司正构建一个专精 AI 研发的自主系统,类似为研究设计的编码智能体,可自行控制 GPU 并循环执行科研与工程任务。创始团队 20 人来自 Anthropic、xAI、Google DeepMind 和 OpenAI。行业Mirendila16zNVIDIA融资自主AI研究10 个信源在谈推荐理由:Mirendil 要做让 AI 自己搞 AI 研发的系统,2 亿美元种子轮,团队来自顶尖实验室,目标是打破大厂垄断。原文
03:27NVIDIA AI@NVIDIAAI精选NVIDIA 发布 Metropolis Blueprint for Video Search and Summarization (VSS) 3,允许用自然语言提示分析实时流和视频库。新版本包含16种智能体技能,如搜索、摘要、警报、报告和片段审查。提供统一开源仓库,附带 Docker 和 Helm 部署配置以加速部署。支持多视频报告,集成 Nemotron 3 Nano Omni 模型实现跨视频和音频的规模化洞察。3D 多摄像头追踪达到生产就绪级别,并取得 SOTA 性能。AI模型NVIDIAMetropolisVSS 3视频搜索智能体7 个信源在谈推荐理由:NVIDIA 刚发了 VSS 3,你的编程代理现在能用一句话搜索、总结视频了,新增16种技能和3D追踪,比以前好用得多。原文
01:12NVIDIA AI@NVIDIAAI76°NVIDIA 发布了 NeMo AutoModel,基于 Hugging Face Transformers v5 为混合专家 (MoE) 模型提供原生支持。通过 Expert Parallelism、DeepEP 和 TransformerEngine 内核,仅需几行代码即可应用优化。实测显示 NeMo AutoModel 将主流 MoE 模型训练吞吐量提升 3.4 到 3.7 倍。该工具是 NeMo 框架的一部分,专为大规模模型构建设计。AI产品NeMo AutoModelMoEHugging Face Transformers v5训练加速NVIDIA7 个信源在谈推荐理由:NVIDIA 出了个 NeMo AutoModel,基于 Hugging Face Transformers v5,几行代码就能给 MoE 模型训练加速 3 倍以上,搞大模型训练的值得看看。原文
13:13vLLM@vllm_projectvLLM 项目宣布支持 DFlash 投机解码,用户只需将 EAGLE-3 检查点替换为 DFlash 检查点即可启用,无需修改代码。该功能通过开源 Speculators 库将 DFlash 草案模型与目标模型的隐藏状态连接。在单块 Blackwell Ultra GPU 上运行 Gemma-4 31B 模型,Math500 基准取得 5.8 倍吞吐量提升,GSM8K 提升 5.3 倍,HumanEval 提升 5.6 倍,MBPP 提升 4.4 倍。AI模型DFlashvLLMGemma-4NVIDIA推理优化10 个信源在谈推荐理由:vLLM 和 NVIDIA 合作推出 DFlash 投机解码,Gemma-4 31B 推理速度提升近 6 倍,配置只需改一行 checkpoint 路径。原文
03:18NVIDIA AI@NVIDIAAI精选NVIDIA发布DFlash,一种开源轻量级块扩散模型,专为投机解码设计。在NVIDIA Blackwell硬件上,DFlash可实现高达15倍的推理吞吐量提升,同时保持相同的用户交互响应速度。与传统逐token解码不同,DFlash一次生成整个token块,由主模型并行验证。该方案即插即用,已集成到SGLang、TensorRT-LLM和vLLM等框架中。AI模型DFlashNVIDIABlackwell投机解码开源模型8 个信源在谈推荐理由:NVIDIA开源了DFlash,用块扩散投机解码让Blackwell推理提速15倍,还支持SGLang和vLLM,随手就能用。原文
01:02LMSYS Org (SGLang)@lmsysorg79°与NVIDIA合作,在GB300上使用SGLang服务DeepSeek-V4,实现5倍吞吐量提升(~2,200→~11,200 tok/s/GPU,交互性~50 tok/s/user)。借助MTP,在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍,峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化(MXFP4)且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。AI模型DeepSeek-V4GB300SGLang推理优化NVIDIA8 个信源在谈推荐理由:想用SGLang在GB300上榨干DeepSeek-V4?NVIDIA合作实测,吞吐翻5倍,交互延迟不变,MTP和量化细节全公开。原文
17:03Aravind Srinivas@AravSrinivas据曼哈顿研究所数据,美国数据中心仅占每日用水量的0.2%。传统冷却系统每MW每年消耗约260万加仑水,而采用45°C液冷技术的AI工厂在适宜气候下可使用干冷却器,将设施冷却水消耗降至接近零。NVIDIA指出,液冷不仅提升水效和能效,还创造了余热回收和社区供暖机会。这一转变颠覆了公众对AI数据中心大量耗水的印象。行业NVIDIA液冷数据中心AI可持续水消耗7 个信源在谈推荐理由:反常识吧?液冷能让AI工厂几乎不耗水,还顺带回收热能, 值得看看数据。原文
16:58Julien Chaumond@julien_c曼哈顿研究所数据显示,美国数据中心用水仅占全美日用水量的0.2%。采用45°C液冷技术后,AI工厂在适宜气候下可用干冷器替代冷却塔,将设施冷却用水从约每年每MW 260万加仑降至接近零。液冷技术同时提升能效,并支持热量回收与社区供暖,使数据中心成为电网资产。行业NVIDIA液冷数据中心能效7 个信源在谈推荐理由:NVIDIA用液冷把数据中心用水几乎干到零,还顺便回收热量给社区,环保和算力两不误。原文
14:06lmarena.ai@lmarena_aiNVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11(两个变体),整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。AI模型Cosmos-3-SuperNVIDIAText-to-Image Arena文本到图像开源模型6 个信源在谈推荐理由:NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平,想试试免费好用的生成工具可以关注它。原文
03:52Nous Research@NousResearch精选Nous Research联合NVIDIA和Stripe启动Hermes Agent加速商业黑客马拉松,鼓励构建能自主执行商业操作的AI代理。NVIDIA提供NemoClaw安全运行、Nemotron 3 Ultra快速推理及代理技能支持。Stripe新Skills让代理能自主购买服务、订阅SaaS。总奖金包括$17,500现金、3台NVIDIA DGX Spark及$9,000 Stripe Credits。提交截止6月30日。行业NVIDIAStripeNous ResearchHermes Agent智能体4 个信源在谈推荐理由:想让你造的AI代理自己挣钱花钱?这个黑客马拉松有NVIDIA和Stripe支持,奖品有现金和DGX Spark,值得试试。原文
18:42Together AI@togethercomputeTogether AI的James Zou与NVIDIA的Venkat Srinivasan将于7月1日在AI Engineer World's Fair上讨论开放模型如何实现集体智能。该活动聚焦开源模型在协作智能系统中的作用。演讲将结合两家公司的技术实践,分析开放模型对多智能体架构的影响。行业Together AINVIDIA开放模型AI Engineer World's Fair6 个信源在谈推荐理由:想了解开放模型怎么支撑多智能体协作?Together AI和NVIDIA的人要聊这个,7月1日别错过。原文
23:17AI Will@FinanceYF573°NVIDIA在SIGGRAPH 2026上发布MotionBricks,该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟,让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计,能动态生成自然动作。AI模型MotionBricksNVIDIA游戏角色机器人动作生成7 个信源在谈推荐理由:NVIDIA搞了个MotionBricks,35万种动作技能随便切换,游戏角色和机器人动起来更自然了,比以前的方案快很多。原文
06:04NVIDIA AI@NVIDIAAI73°NVIDIA Research 推出 SpatialClaw,一个无需训练的智能体,通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块,检查中间结果并跨步骤调整策略。感知输出作为普通变量,可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分,在 6 种不同模型骨干上表现稳定。AI模型SpatialClawNVIDIA智能体多模态视觉推理8 个信源在谈推荐理由:SpatialClaw 不用额外训练,靠写代码搞定复杂视觉任务,在 20 个基准上平均提升 11.2 分,还兼容多种模型。原文
03:03berryxia@berryxia73°NVIDIA开源了SOMA-X v0.2,一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性,采用Apache 2.0许可证。它专为机器人和物理AI设计,可用于机器人训练、物理仿真和动作迁移,解决了不同机器人体型不统一导致动作数据难以复用的问题。AI模型SOMA-XNVIDIA3D人体模型机器人物理AI10 个信源在谈推荐理由:NVIDIA开源了SOMA-X v0.2,单一骨架就能适配不同体型,机器人动作数据复用门槛降低,训练效率提升。原文
01:58Jim Fan@jimfan精选72°ENPIRE赋予8个Codex智能体机器人集群和GPU资源,自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。AI产品ENPIRECodexNVIDIA智能体机器人10 个信源在谈推荐理由:NVIDIA让8个AI智能体自己控制机器人干活,还能绑扎带装显卡,而且要开源,你可以在家搭机器人实验室了!原文
01:57Jim Fan@jimfan76°NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。AI模型ENPIRENVIDIA机器人智能体自主循环8 个信源在谈推荐理由:NVIDIA搞了个ENPIRE,让AI自己操控机器人反复试错,真实任务成功率干到99%,连GPU都能自己插。原文
16:34AI Will@FinanceYF583°NVIDIA 发布了 SANA-Streaming 模型,支持对长达一分钟的视频进行实时编辑。用户可以在视频播放过程中更改服装、背景、风格和场景。该模型无需等待渲染,即可直接看到修改结果。AI模型NVIDIASANA-Streaming视频生成实时编辑8 个信源在谈推荐理由:NVIDIA 出了 SANA-Streaming,放视频时就能实时换衣服换背景,一分钟的长视频也能改原文
14:23AlphaSignal@AlphaSignalAI精选NVIDIA开源了AI技能安全扫描器SkillSpector。研究发现26.1%的已发布AI技能存在漏洞,36%包含提示注入向量。SkillSpector无需扫描恶意代码即可检测危险特性,帮助开发者避免在安装未扫描技能时的常见风险。该工具专为检查AI技能潜在安全问题设计,可集成到开发流程中。AI产品NVIDIASkillSpectorAI安全提示注入开源工具7 个信源在谈推荐理由:NVIDIA开源了SkillSpector,专门扫描AI技能的漏洞和提示注入。别像99%的开发者那样不检查就直接装,先扫一下再安心用。原文
13:12MiniMax_AI@MiniMax_AIMiniMax 宣布其 M3 模型端点获得 NVIDIA 官方认可,并已上线免费 GPU 加速版本。用户现在可以免费体验基于 NVIDIA GPU 加速的 M3 模型推理服务。该端点支持高性能计算,适用于多种 AI 任务。AI产品MiniMaxM3NVIDIAGPU加速3 个信源在谈推荐理由:MiniMax 的 M3 模型免费加速了原文
11:20AI Will@FinanceYF5Lilly、Novartis和J&J与Isomorphic Labs达成合作,投入数十亿美元用于AI设计的药物。Lilly还与NVIDIA启动了一项AI药物发现计划。Synaptic Data梳理了AI药物发现技术栈8层上的110+家初创公司。行业Isomorphic LabsLillyNovartisJ&JNVIDIAAI药物发现8 个信源在谈推荐理由:三大药企联手AI公司砸钱原文
11:05lmarena.ai@lmarena_ai精选NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名,在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出,但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽,排名仍在稳定中。AI模型Nemotron 3 UltraNVIDIAAgent Arena开源模型智能体10 个信源在谈推荐理由:NVIDIA 开源模型在智能体评测中排第5原文
09:55rohanpaul_ai@rohanpaul_ai精选73°NVIDIA 发布了首个智能体 AI 基准测试 AgentPerf 的结果。该基准由 Artificial Analysis 推出,测试系统在保持响应性的同时能并发运行多少个智能体。GB300 NVL72 在最低服务层级达到每兆瓦 61.4K 并发智能体,而 H200 仅为 2.6K,性能提升约 23.6 倍。测试模拟了真实编码智能体路径,涵盖 12 种以上编程语言,请求长度从 5K 到 131K token 不等,平均约 27K token。性能提升得益于 72 块 GPU 通过 NVLink 组成机架级系统,以及优化 MoE 专家分配、通信与计算重叠等软件技术。AI模型NVIDIAGB300 NVL72H200AgentPerf智能体10 个信源在谈推荐理由:NVIDIA 首个智能体基准,GB300 比 H200 强 23 倍原文
13:34Thinking Machines Lab@thinkymachines83°Think Machines 宣布与 NVIDIA 合作,利用其硬件和平台来训练前沿模型,并提供可定制的 AI 解决方案。这一合作将加速模型训练效率,降低开发门槛,使企业能够更灵活地部署定制化 AI。NVIDIA 的算力支持将帮助 Think Machines 在竞争激烈的 AI 市场中提升模型性能。行业NVIDIAThink Machines模型训练AI 定制合作10 个信源在谈推荐理由:NVIDIA 与 Think Machines 的合作意味着更强大的算力支持,做模型训练和定制 AI 的团队可以关注这一进展,看看能否利用其平台加速自己的项目。原文
12:50Artificial Analysis@ArtificialAnlys精选随着用户和企业赋予 AI 模型和智能体更多自主权,筛选其输入输出的护栏变得至关重要。然而,现有的护栏评测基准未能跟上模型智能的发展速度。与 NVIDIA 合作,该团队在三个开放数据集上独立评测了护栏与审核模型,衡量了检测质量、延迟以及捕捉不安全内容与过度拒绝安全内容之间的权衡。结果显示,没有模型能全面胜出,且缺乏统一的评判标准。这被视为一个测量问题的早期步骤,随着模型承担更多实际工作,该问题将愈发重要。行业AI 安全护栏评测NVIDIA模型审核智能体10 个信源在谈推荐理由:AI 安全护栏评测标准滞后,做模型部署和安全审核的团队需要关注这个评测缺口,建议点开了解当前护栏模型的真实表现。原文
12:42Sebastian Raschka@rasbt精选Nemotron 3 Ultra 是 NVIDIA 发布的新一代开源权重模型,延续了前代 Super 变体的 Mamba-2 注意力混合架构和 LatentMoE 设计,但规模更大。该模型在能力与效率之间取得了极佳平衡,性能表现令人印象深刻。开源权重意味着开发者可以自由下载、微调和部署,适合资源受限但追求高性能的场景。这一发布进一步丰富了开源大模型生态,为研究者和工程师提供了新的选择。AI模型Nemotron 3 UltraMamba-2LatentMoE开源/仓库NVIDIA10 个信源在谈推荐理由:NVIDIA 把 Mamba-2 混合架构和 LatentMoE 做到更大更强,追求高性价比模型的团队可以直接拿来用,省去从头训练的昂贵成本。原文
12:31karminski-牙医 (AI工具)@karminski3精选Google发布了Gemma小模型的Diffusion版本,名为Diffusion Gemma,大小26B但激活参数量仅4B。与NVIDIA合作针对RTX 4090和5090优化,5090上每秒可生成700+ token。Diffusion模型像刮奖一样逐片生成文本,速度远快于传统逐字生成模型,但输出质量略低。在AIME 2026数学测试中达到Gemma4-26B-A4B的94%水平,在Agent能力测试中达到82%。4bit量化版本仅需16G显存即可运行。AI模型Diffusion模型GemmaGoogleNVIDIA推理加速10 个信源在谈推荐理由:Diffusion Gemma把文本生成速度拉到单卡700TPS,做实时对话或高吞吐推理的团队可以直接用,4bit量化16G显存就能跑,值得试试能否做投机解码的草稿模型。原文
12:29Mira Murati (TML)@miramurati前 OpenAI CTO Mira Murati 在 X 上发文感谢 NVIDIA CEO Jensen Huang 及其团队的支持,宣布双方合作部署至少 1GW 的 Vera Rubin 系统。该系统旨在将可适应的协作 AI 带给每个人,标志着 AI 基础设施的大规模扩展。Vera Rubin 是 NVIDIA 下一代 AI 计算平台,此次合作将显著提升 AI 训练和推理能力。行业NVIDIAVera RubinAI 基础设施合作Mira Murati10 个信源在谈推荐理由:AI 基础设施的规模化部署是行业关键瓶颈,关注算力布局的团队和开发者值得了解这一合作动向。原文
07:02NVIDIA AI@NVIDIAAINVIDIA 宣布将参加 2026 年在洛杉矶举办的 SIGGRAPH 大会,展示神经渲染、世界模型、物理 AI 等前沿技术,并提供动手实验室。SIGGRAPH 是计算机图形学与交互技术领域的顶级会议,NVIDIA 的参与意味着其最新图形与 AI 研究成果将集中亮相。对于图形开发者、AI 研究者和游戏行业从业者来说,这是了解下一代渲染与仿真技术的重要窗口。行业NVIDIASIGGRAPH 2026神经渲染物理 AI世界模型9 个信源在谈推荐理由:NVIDIA 把 SIGGRAPH 当作技术风向标,做图形渲染、物理仿真或 AI 模型的团队值得关注,可以提前规划参会或跟进后续发布。原文
06:16NVIDIA AI@NVIDIAAI精选NVIDIA Research发布开放模型MotionBricks,基于35万+运动片段实现每秒15,000帧的实时角色动画。该模型无需手工制作过渡或微调,可直接用于角色动画,并支持机器人应用。相关论文将发表于SIGGRAPH 2026,代码和演示已开源。AI模型MotionBricksNVIDIA角色动画实时机器人10 个信源在谈推荐理由:NVIDIA开源实时动画,35万片段15K FPS原文
04:41NVIDIA AI@NVIDIAAINVIDIA 发布 Nemotron 3 模型,采用混合 Mamba Transformer 架构,通过 Mamba-2 降低注意力机制开销,实现亚二次复杂度。潜在 MoE 通过降维投影减少 HBM 与 SRAM 间的数据移动,并增加专家数量以提升稀疏性效率。多 token 预测(MTP)使模型在训练时能预见未来 token,推理时可用于推测解码。模型采用新的 OpenMDW 1.1 许可证。AI模型Nemotron 3混合 Mamba Transformer潜在 MoE多 token 预测NVIDIA10 个信源在谈推荐理由:Nemotron 3 的架构创新直击大模型推理效率瓶颈,做模型优化和部署的开发者值得关注其混合 Mamba 和潜在 MoE 的具体实现,可以直接参考其设计思路。原文
04:04Together AI@togethercompute精选Trajectory Labs 在 Together Compute 和 NVIDIA 的支持下,仅用不到 24 小时就在一个开放模型上实现了前沿模型级别的性能。这展示了当优秀开源模型与合适的训练基础设施结合时,可以快速取得显著成果。Together Compute 为此提供了算力支持,凸显了开放模型生态的潜力。AI模型开放模型后训练算力基础设施Together ComputeNVIDIA10 个信源在谈推荐理由:对于关注开源模型训练效率的团队,这个案例证明了 24 小时内就能让开放模型达到前沿水平,值得研究其训练流程。原文