01:52NVIDIA AI@NVIDIAAI精选DynoSim 是 NVIDIA 推出的工作负载驱动模拟工具,用于优化 Dynamo 推理服务栈的部署。它将 exhaustive 的部署搜索转化为 simulate-then-verify 循环,可在虚拟时间线上建模整个栈。团队能通过高保真模拟快速筛选数千种配置,然后仅在真实硬件上验证最佳候选。测试显示其模拟速度比真实时间快 1500 倍。技巧NVIDIADynoSimDynamo推理优化模拟3 个信源在谈推荐理由:NVIDIA 搞了个模拟器,部署配置筛选快千倍原文
08:06Julien Chaumond@julien_cNVIDIA 发布了 DeepSeek-V4-Pro-NVFP4 的修复版本,该模型基于 DeepSeek-V4 架构,采用 NVFP4 精度优化,旨在提升推理效率和性能。修复版解决了之前版本中的一些问题,使模型更加稳定可靠。对于使用 NVIDIA 硬件进行 AI 推理的开发者来说,这是一个值得关注的更新。AI模型DeepSeek-V4NVIDIANVFP4模型修复推理优化5 个信源在谈推荐理由:NVIDIA 官方修复版解决了 DeepSeek-V4 在自家硬件上的精度和稳定性问题,用 NVIDIA GPU 做推理的团队可以直接拉取使用,省去自己调优的麻烦。原文
07:24marktechpost@Asif RazzaqNVIDIA 提出 X-Token,一种投影引导的跨分词器知识蒸馏(KD)方法,解决了 GOLD 方法中的两个结构性缺陷。在 Llama-3.2-1B 模型上,X-Token 将 GSM8k 准确率从 2.56% 提升至 15.54%,并在多个基准测试中平均超越 GOLD 3.82 分。该方法通过投影层对齐教师和学生模型的分词器,实现了更有效的知识迁移。X-Token 为小模型蒸馏大模型知识提供了新思路,尤其适用于资源受限场景。论文知识蒸馏NVIDIALlama-3.2-1BGSM8k跨分词器6 个信源在谈推荐理由:X-Token 解决了知识蒸馏中分词器不匹配的痛点,做模型压缩或边缘部署的团队可以直接用这个思路提升小模型推理能力,值得关注。原文
06:09NVIDIA AI@NVIDIAAINVIDIA 发布了 Metropolis 视频搜索与摘要蓝图的智能体技能和模块化架构,允许开发者直接加载技能到兼容的编码智能体中,自动部署整个堆栈,无需手动配置多个微服务。用户可以通过自然语言对话界面,从数小时的视频中搜索、获取片段、摘要和答案,将视频转化为可搜索、可操作的情报。该更新大幅降低了视频分析的门槛,适用于安防、零售、工业监控等场景。AI产品NVIDIA视频搜索智能体Metropolis视频分析5 个信源在谈推荐理由:做视频分析或监控系统的开发者,现在可以用自然语言直接检索数小时视频内容,省去手动配置微服务的麻烦,值得一试。原文
05:15NVIDIA AI@NVIDIAAINVIDIA AI 宣布,Harvey 与 Trajectory Labs 合作,基于 NVIDIA Nemotron 3 Super 模型进行后训练,专注于复杂法律任务。他们在 Harvey 的 Legal Agent Benchmark(LAB)上测试了 1200+ 端到端法律任务,覆盖 24 个业务领域。初始结果显示,后训练的 Nemotron 3 Super 在性能上可媲美闭源前沿模型。该项目强调开放权重、可审计性和数据主权,支持持续学习(continual learning),使法律智能体能够从反馈中不断改进。这标志着开放模型在专业领域应用的重要突破。AI模型NVIDIANemotron 3 Super法律 AI后训练开放权重5 个信源在谈推荐理由:法律 AI 团队终于有了可审计、可定制的开放模型选择——Nemotron 3 Super 在复杂法律任务上追平闭源模型,做法律科技或合规自动化的开发者可以直接关注这个开源方案。原文
15:52IT之家(博客/媒体)精选戴尔在 COMPUTEX 2026 新闻资料袋中预告将推出基于 NVIDIA "N1X" 芯片的 XPS 机型,相关信息将于北京时间 6 月 1 日 11:00 解禁。此前联想 "N1X" 版 YOGA 360 16 已通过 3C 认证,两家 OEM 动作指向 NVIDIA 将在 COMPUTEX 2026 正式发布 "N1X" SoC。泄露信息显示 "N1X" 与 DGX Spark 的 GB10 同源,采用 20 核 Arm CPU + 6144 CUDA GPU 组合,支持 256-bit LPDDR5x 内存。AI产品N1XXPSDellNVIDIA电脑展5 个信源在谈推荐理由:戴尔XPS要上N1X芯片了原文
14:33阶跃星辰 Stepfun@Stepfun_AI精选Step 3.7 Flash 模型在发布首日即获得 NVIDIA 的全面支持,包括 NIM 推理微服务、NeMo 框架以及 GPU 加速端点。这意味着开发者可以立即在 NVIDIA 的生态系统中部署和运行该模型,无需额外适配。NVIDIA 的首日支持通常意味着模型经过了优化,能充分利用 GPU 硬件性能,降低推理延迟和成本。这对于需要高性能推理的 AI 应用团队来说是一个重要信号,表明 Step 3.7 Flash 已具备企业级部署条件。AI模型Step 3.7 FlashNVIDIANIMNeMoGPU加速5 个信源在谈推荐理由:NVIDIA 首日支持意味着 Step 3.7 Flash 可直接用于生产环境,做推理部署的团队可以省去适配工作,直接使用 NIM 和 NeMo 加速。原文
09:06NVIDIA AI@NVIDIAAI精选76°NVIDIA 宣布推出 Step 3.7 Flash 模型,这是一个 198B 参数的混合专家(MoE)模型,但仅需 11B 活跃参数即可运行,大幅降低推理成本。该模型支持 256K 上下文长度,并原生支持图像和视频输入。即日起可在 build.nvidia.com 上通过 GPU 加速端点使用,也可通过 NVIDIA NIM 微服务部署,并支持使用 NeMo 框架进行微调。这一发布标志着 NVIDIA 在高效大模型领域的重要进展,尤其适合需要多模态理解和长上下文处理的应用场景。AI模型Step 3.7 FlashNVIDIAMoE多模态长上下文5 个信源在谈推荐理由:198B 参数但仅 11B 活跃,推理效率极高,做多模态应用或长文档处理的团队可以直接在 NVIDIA 平台试用,省成本又省心。原文
08:37NVIDIA AI@NVIDIAAI精选NVIDIA官方提供了在NVIDIA GPU上运行Step 3.7 Flash的详细指南。该指南包含部署步骤和性能优化建议,适用于开发者快速上手。开发者可通过NVIDIA开发者博客获取具体操作方法和配置参数。技巧Step 3.7 FlashNVIDIAGPU部署推理部署1 个信源在谈推荐理由:教你部署Step 3.7 Flash原文
03:07NVIDIA AI@NVIDIAAI72°NVIDIA 研究团队的 CVPR2026 论文 LocateAnything 在 HuggingFace 上成为趋势第一。该模型是一种视觉语言检测模型,创新性地并行解码边界框,而非传统的一次一个坐标。在 1.38 亿高质量样本上训练,显著提升了定位精度和吞吐量,适用于 AI 智能体和机器人等需要快速精准视觉定位的场景。项目页面已公开。论文视觉检测边界框预测NVIDIACVPR2026HuggingFace4 个信源在谈推荐理由:做视觉检测或机器人感知的团队,LocateAnything 的并行解码思路能直接提升实时性,值得点开看看项目页。原文
01:48NVIDIA AI@NVIDIAAINVIDIA 宣布在其开源模型系列中采用 Linux 基金会的 OpenMDW 框架,旨在简化并统一模型、代码、文档和数据的许可协议。OpenMDW-1.1 是一个专为 AI 模型设计的宽松、统一的法律框架,可减少开发者和企业使用开源 AI 时的法律摩擦。该框架将应用于 Cosmos、Isaac GR00T、Ising 和 Nemotron 等模型系列。此举有望推动 AI 开源生态的标准化,降低合规成本。行业开源/仓库许可协议NVIDIAOpenMDWLinux 基金会4 个信源在谈推荐理由:NVIDIA 带头统一开源模型许可,解决了 AI 开发者最头疼的许可证碎片化问题。做模型部署或企业级 AI 应用的团队,建议关注 OpenMDW 框架,能省去不少法务沟通成本。原文
23:33rohanpaul_ai@rohanpaul_aiAtreides 管理合伙人 Gavin Baker 指出,AI 相关公司估值存在严重不一致:内存制造商 PE 仅 3-5 倍,而 NVIDIA 的 PE 也很低。他认为,市场将 NVIDIA、内存、定制芯片、光网络、电力设备、冷却系统和数据中心建设者都视为同一支出热潮的赢家,但每个板块定价的是不同的繁荣版本。这种横截面低效意味着市场未能一致地对相关 AI 公司进行排名。利润池会流向最难替代、最难延迟、最难被客户压价的部分:如果稀缺的是电力和物理容量,基础设施供应商应获得溢价;如果稀缺的是加速计算,NVIDIA 和内存可能被低估。ASIC 叙事进一步增加了迷雾,Broadcom 在定制芯片上快速增长,但未必能夺取 NVIDIA 最有价值的增长部分。行业NVIDIAAI 投资估值分析半导体数据中心3 个信源在谈推荐理由:Baker 的视角戳破了 AI 投资中的估值幻觉,做 AI 硬件投资或关注产业链的读者,看完会重新审视 NVIDIA 与基础设施公司的相对价值。原文
20:05rohanpaul_ai@rohanpaul_ai76°NVIDIA 发布了由 Phoronix 完成的 Vera CPU 基准测试报告。报告显示,Vera 相比当前 128 核 x86 CPU 整体性能领先 1.5 倍,相比前代 Grace CPU 几何平均性能提升 1.6 倍。Vera 采用 Armv9.2 架构,每核内存带宽是传统 x86 的 4 倍以上,LPDDR5X 带宽达 1.2TB/s,功耗仅 30W,而典型 DDR5 服务器功耗超 100W。对于智能体 AI 场景,CPU 端任务(如工具调用、文件读写、浏览器操作)日益繁重,Vera 的高效计算能力将显著提升这类工作负载的表现。AI产品NVIDIAVera CPUArmv9.2服务器芯片智能体6 个信源在谈推荐理由:NVIDIA 用 Arm 架构正面挑战 Intel/AMD 服务器 CPU,性能更强且功耗更低,做 AI 推理和智能体系统的团队值得关注——CPU 端负载正在变重,Vera 可能是更优选择。原文
10:41WeAreLegora@WeAreLegora法律 AI 公司 Legora 宣布完成 5000 万美元 D 轮扩展融资,新增 Atlassian 和 NVIDIA 旗下风投 nVentures 作为企业投资者。公司正在构建面向法律工作的全自主智能体操作系统,目标是实现 AI 不仅辅助、还能在适当人类监督下自主执行任务。这笔资金将用于加速企业级 AI 在法律领域的应用落地。行业法律 AI智能体企业融资AtlassianNVIDIA4 个信源在谈推荐理由:法律行业终于迎来真正的 AI 执行层——Legora 的智能体操作系统让法律工作从辅助走向自主,律所和法务团队值得关注这一趋势。原文
10:22LangChain@LangChainAILangChain 在 Interrupt 大会上宣布成立 LangChain Labs,这是一个专注于智能体持续学习的应用研究团队。该实验室已与 NVIDIA、Harvey、PrimeIntellect、Fireworks_AI 和 Baseten 等公司建立早期研究合作。LangChain Labs 旨在解决智能体在长期任务中如何持续学习和适应的问题,这对于构建更可靠的 AI 代理系统至关重要。这一举措标志着 LangChain 从框架开发向前沿研究领域的扩展。AI产品LangChain智能体持续学习研究实验室NVIDIA5 个信源在谈推荐理由:LangChain Labs 聚焦智能体持续学习这一核心痛点,做 AI 代理开发的团队值得关注——它可能解决长期任务中代理性能衰减的问题,建议跟进合作动态。原文
08:47NVIDIA AI@NVIDIAAI精选72°NVIDIA 推出 Dynamo Snapshot,一种针对 Kubernetes 上推理工作负载的快速启动方案。该方案利用 GPU 内存快照(GMS)实现高速互连上的并发权重恢复,同时结合 Linux 原生 AIO 和并行 memfd 恢复技术,加速 CRIU 恢复性能。在推理部署中,需求波动导致冷启动耗时数分钟,造成 GPU 闲置。Dynamo Snapshot 将启动时间从分钟级缩短至 5 秒以内,显著提升 GPU 利用率和推理效率。AI产品推理工作负载KubernetesGPU 利用率冷启动优化NVIDIA5 个信源在谈推荐理由:Kubernetes 上跑推理的团队终于不用忍受 GPU 空转几分钟了——Dynamo Snapshot 把冷启动压到 5 秒,做弹性扩缩容的 MLOps 工程师可以直接拿来用。原文
01:12marktechpost@Asif Razzaq76°NVIDIA 研究人员推出 Polar,一个 token 忠实展开框架,用于通过强化学习训练语言智能体,无需修改其智能体框架。Polar 在框架和推理服务器之间放置模型 API 代理,捕获 token 级交互并重建训练器就绪轨迹。基于 Qwen3.5-4B 基础模型使用 GRPO,Polar 在 Codex 框架下将 SWE-Bench Verified pass@1 提升 22.6 个百分点,在 Claude Code 下提升 4.8 个百分点,在 Pi 下提升 6.2 个百分点。该框架已注册为 NeMo Gym 环境,并在 ProRL Agent Server 仓库中发布。AI模型NVIDIAPolarGRPO代码智能体强化学习4 个信源在谈推荐理由:Polar 解决了 RL 训练智能体时需修改框架的痛点,做代码智能体或 RL 训练的开发者可以直接集成,无需改动现有工具链,值得一试。原文
03:35NVIDIA AI@NVIDIAAINVIDIA AI 官方账号在 X 平台发布 Nemotron Labs 的最新研究成果,聚焦文本扩散模型与弹性推理技术。文本扩散模型是一种新型生成式 AI 方法,能够更高效地处理文本生成任务,而弹性推理则旨在优化推理过程中的计算资源分配,提升模型在复杂任务中的表现。该技术有望降低大模型的部署成本,并提高推理速度,对 AI 研究和应用开发者具有重要参考价值。论文文本扩散弹性推理NVIDIANemotron Labs推理优化2 个信源在谈推荐理由:NVIDIA 在文本生成和推理效率上的新突破,做 NLP 或大模型部署的团队值得关注,能直接启发你优化模型性能。原文
22:56NVIDIA AI@NVIDIAAINVIDIA AI 官方账号发布了一段由 Julia Turc 制作的关于“世界模型”的讲解视频。视频澄清了世界模型与视频生成的区别,探讨了其超越“AI 垃圾”的潜力,并幽默回应了 Yann LeCun 的争议。该视频旨在帮助观众理解这一当前 AI 领域最热门但最模糊的概念之一。AI模型世界模型NVIDIA视频生成AI 科普Yann LeCun2 个信源在谈推荐理由:世界模型是当前 AI 最模糊的概念之一,这个视频帮你理清它与视频生成的区别,想搞懂 AI 前沿方向的建议点开。原文
00:49NVIDIA AI@NVIDIAAI76°NVIDIA AI 官方账号展示了一个本地AI部署方案:使用两台 DGX Spark 服务器和 MiniMax M2.7 NVFP4 模型,实现了16个本地AI智能体同时运行。所有推理都在本地完成,无需调用云端API。这展示了在本地硬件上运行多个AI智能体的可行性,对于需要低延迟、高隐私或离线环境的AI应用场景具有重要意义。AI产品NVIDIADGX SparkMiniMax M2.7本地智能体边缘计算推荐理由:本地同时跑16个AI智能体,做边缘计算或隐私敏感型AI应用的团队可以直接参考这个方案,无需依赖云API。原文
20:22阿里云 Alibaba Cloud@alibaba_cloud精选在 2026 年 Qwen 大会上,NVIDIA 高级解决方案架构师 Jian Zhai 在基础模型论坛上深入解析了 Qwen 推理优化技术,展示了通过 NVIDIA 全栈加速实现的突破性性能提升。该演讲聚焦于如何利用 NVIDIA 的软硬件协同优化,显著降低 Qwen 模型的推理延迟并提高吞吐量,为 AI 应用落地提供关键支持。这一合作体现了 AI 原生生态的快速发展,对部署 Qwen 模型的开发者和企业具有重要参考价值。AI模型QwenNVIDIA推理优化全栈加速AI 原生2 个信源在谈推荐理由:NVIDIA 全栈加速让 Qwen 推理性能实现突破,做模型部署和推理优化的工程师可以直接参考其技术方案,值得关注。原文
15:43marktechpost@Asif Razzaq精选70°NVIDIA 发布 Gated DeltaNet-2,一种线性注意力层,将 Delta 规则中的擦除和写入操作解耦为通道级擦除门 b_t 和写入门 w_t。在 1.3B 参数、100B FineWeb-Edu 令牌训练下,它在语言建模、常识推理和长上下文检索任务上超越 Mamba-2、Gated DeltaNet、KDA 和 Mamba-3。最大提升出现在 RULER S-NIAH 和多键针检索基准上。AI模型大模型推理模型MambaNVIDIA线性注意力4 个信源在谈推荐理由:NVIDIA 新线性注意力,解耦擦写门原文
09:53Hugging Face: Blog(博客/媒体)精选NVIDIA 发布了 Nemotron-Labs 扩散语言模型,该模型采用扩散机制替代传统的自回归生成方式,大幅提升文本生成速度,接近光速。与 GPT-4 等模型相比,Nemotron-Labs 在保持生成质量的同时,推理速度提升了一个数量级。该模型在多个基准测试中表现出色,尤其适合需要低延迟的实时应用场景。这一突破可能改变大语言模型的部署范式,让文本生成更接近实时交互。AI模型扩散模型文本生成NVIDIA推理加速Nemotron-Labs2 个信源在谈推荐理由:NVIDIA 的扩散语言模型将文本生成速度推向新高度,做实时对话或低延迟应用的开发者可以直接关注,它可能改变你对大模型推理速度的认知。原文
05:18NVIDIA AI@NVIDIAAI72°NVIDIA Research 推出 LongLive-2.0,一个端到端的 NVFP4 训练与推理系统,专门解决长视频生成问题。该系统将 NVFP4 感知训练、蒸馏和 W4A4 推理对齐,弥补了低精度部署中训练与运行之间的差距。在保持基准质量的同时,显著提升了速度和内存效率。这标志着长视频生成从模型问题转向系统问题,为实际部署提供了更高效的方案。AI模型NVIDIA长视频生成NVFP4训练推理系统低精度部署2 个信源在谈推荐理由:长视频生成一直受限于计算和内存瓶颈,NVIDIA 这次从系统层面给出了端到端方案。做视频生成模型训练或部署的团队,可以直接参考这套 NVFP4 对齐方法,提升效率。原文
04:21NVIDIA AI@NVIDIAAI精选NVIDIA 推出 LongLive-2.0,支持生成 720p 分辨率的长视频。该模型在多镜头序列中保持主体和背景一致性,并能在视频分块边界处切换提示词。相比前代,LongLive-2.0 在长视频连贯性和用户控制性上有所提升。AI模型LongLive-2.0NVIDIA视频生成长视频2 个信源在谈推荐理由:NVIDIA 新模型能生成长视频还保持一致性原文
00:12NVIDIA AI@NVIDIAAINVIDIA 发布了开源 AI-Q 智能体技能包,将构建深度研究管线的流程封装为可移植技能。用户可将该技能包直接放入智能体框架中,智能体即可将研究任务委派给本地或托管的 AI-Q 服务器,并返回带有引用的详细报告。该技能包支持主流智能体框架,降低了构建复杂研究管线的门槛。在 Codex 等环境中演示了其便捷性,适合需要自动化深度研究的开发者和团队。AI产品智能体开源/仓库深度研究NVIDIAAI-Q推荐理由:NVIDIA 把深度研究能力打包成即插即用的技能,做智能体开发或自动化研究的团队可以直接集成,省去从零搭建管线的麻烦。原文
01:10NVIDIA AI@NVIDIAAI76°NVIDIA 发布了 NVIDIA-Verified Agent Skills,旨在解决 AI 智能体技能引入的安全漏洞问题。这些经过验证的技能提供透明信息,包括技能功能、来源、风险以及是否被修改。每个技能都附带技能卡,并基于 agentskills.io 开放规范构建,确保在 Claude Code、OpenAI Codex 和 Cursor 等平台上可靠运行。此举提升了智能体生态的安全性和互操作性。AI产品智能体安全NVIDIA技能验证互操作性10 个信源在谈推荐理由:AI 智能体开发者终于有了安全可追溯的技能来源——NVIDIA 的 Verified Skills 解决了技能引入的漏洞风险,做智能体应用或使用 Claude Code、Codex 的团队可以直接集成,减少安全审查成本。原文
07:59NVIDIA AI@NVIDIAAI83°NVIDIA AI宣布与SpaceXAI合作,利用Colossus 2集群的百万H100等效算力,从零开始训练一个规模显著更大的模型,总计算量提升10倍。双方将结合各自的数据和训练技术,预期模型能力将有重大飞跃。这一合作展示了超大规模算力在AI前沿研究中的关键作用,可能推动下一代基础模型的性能突破。AI模型NVIDIASpaceXAI大模型训练算力Colossus 23 个信源在谈推荐理由:算力提升10倍意味着模型能力可能迎来质变,关注大模型训练的开发者可以了解这一合作的技术路径和潜在影响。原文
07:59NVIDIA AI@NVIDIAAINVIDIA AI 官方推特宣布了 Nemotron 系列模型的完整论文,并推荐用户阅读 @llm_wizard 的详细解读。该论文可能涉及 NVIDIA 在大型语言模型领域的最新进展,包括模型架构、训练方法或性能优化。对于关注 AI 前沿研究和 NVIDIA 技术动态的开发者与研究者,这是一份重要的技术文档。论文NVIDIANemotron论文大型语言模型技术解读推荐理由:NVIDIA 的 Nemotron 论文是了解其 LLM 技术路线的一手资料,做模型训练或推理优化的开发者值得仔细研读,配合 @llm_wizard 的解读能更快抓住重点。原文
08:44NVIDIA AI@NVIDIAAI76°NVIDIA 发布了 Nemotron-Labs-Diffusion 系列扩散语言模型,与传统逐 token 生成不同,该模型能在单次推理中并行生成多个 token,并支持在生成过程中进行修订。这种设计充分利用了现代 GPU 的并行计算能力,显著提升推理速度。模型系列包含 3B 到 14B 参数规模,并提供了视觉-语言变体。目前该模型已开源可用。AI模型扩散模型并行生成NVIDIANemotron推理加速推荐理由:NVIDIA 的扩散语言模型打破了传统逐 token 生成瓶颈,做推理加速或大模型部署的团队可以直接拿来提升 GPU 利用率,值得关注。原文
08:20berryxia@berryxiaNVIDIA CEO Jensen Huang 在演讲中指出,每个工程师未来都要管理和使用几百个AI agent,这并非未来时,而是现在进行时。普通人使用Claude只发挥了其10%的能力,真正的高手将Claude当作操作系统,通过建立工作流、链式输出、掌控上下文,让AI按照自己的思考方式工作。同一份订阅,同一款模型,使用方式不同导致结果天差地别。行业AI agentClaude工作流NVIDIA工程师3 个信源在谈推荐理由:Jensen Huang 这句话点醒了无数AI使用者——别再只把Claude当问答工具,做AI工作流的开发者/工程师可以直接用它重构效率,看完你会重新认识Claude。原文
03:33NVIDIA AI@NVIDIAAINVIDIA AI 发布了一种新架构,结合了混合线性注意力、双分支相机控制、两阶段生成流水线和鲁棒标注流水线。该设计在保持视觉质量的同时,显著提高了动作跟随准确性和吞吐量。适用于视频生成和动作驱动的视觉任务,为高精度、高效率的生成模型提供了新方案。AI模型NVIDIA混合线性注意力双分支相机控制两阶段生成动作跟随推荐理由:做视频生成和动作跟随的开发者可以关注——NVIDIA 这套架构在精度和吞吐量上都有提升,值得试一下新思路。原文
03:31NVIDIA AI@NVIDIAAI76°NVIDIA 研究团队开源了 SANA-WM,一个 2.6B 参数的世界模型,能在单张 GPU 上根据一张图片、文本描述和相机轨迹生成 60 秒可控视频。该模型原生支持精确的相机控制,为视频生成和世界模拟提供了新的可能性。SANA-WM 的开源发布降低了高质量可控视频生成的门槛,对内容创作、游戏和仿真领域有重要意义。AI模型世界模型视频生成相机控制开源/仓库NVIDIA2 个信源在谈推荐理由:NVIDIA 把世界模型的门槛拉到单卡可跑,做视频生成或 3D 仿真的开发者可以直接拿来用,60 秒可控视频不再是云端专属。原文
00:47berryxia@berryxia88°NVIDIA研究员Yukang Chen开源了LongLive 2.0,这是全球首个端到端支持4-bit量化的超长视频生成基础设施,覆盖训练和推理全流程。核心技术包括FP4量化和并行加速,在5B模型上实现45.7 FPS的实时生成速度。该工具支持真实视频训练、few-step蒸馏、多shot训练/推理、序列并行、NVFP4 KV cache和异步VAE解码部署。此前长视频生成面临速度慢或长度受限的问题,LongLive 2.0将4-bit长视频实时生成能力推向开源社区。AI产品NVIDIALongLive 2.04-bit量化视频生成开源/仓库2 个信源在谈推荐理由:做视频生成或AI基础设施的开发者终于有了一个能跑长视频的4-bit开源方案,NVIDIA把训练到推理的整套加速打法打包好了,建议直接试代码。原文
20:02AlphaSignal@AlphaSignalAI88°NVIDIA 与牛津大学联合发表论文,提出 EGGROLL 方法,将进化策略(Evolution Strategies)扩展到十亿参数模型,无需反向传播即可训练。该方法用两个低秩矩阵替代密集随机扰动矩阵,大幅降低内存消耗,达到纯推理吞吐量的 91%。EGGROLL 支持数十万并行变异,可与不可微分组件配合,在推理任务上与 GRPO 竞争。团队还训练了纯 8 位整数循环语言模型 EGG,非线性来自整数溢出裁剪,而非激活函数,预训练时种群规模超过百万。论文进化策略反向传播NVIDIA低秩矩阵整数训练推荐理由:这项研究打破了深度学习十年来的反向传播依赖,做大规模模型训练或非可微分任务(如强化学习、神经架构搜索)的团队可以直接关注 EGGROLL,它可能改变你构建模型的方式。原文
00:30NVIDIA AI@NVIDIAAI精选OpenShell v0.0.43 引入双向TTY流,提升终端交互实时性。TUI中新增OIDC认证,增强用户身份验证。HTTPS与mTLS配置解耦,简化安全通信管理。沙箱从ext4磁盘启动,并移除沙箱映射器中的DNS以阻止数据泄露。AI产品OpenShellNVIDIAAI安全3 个信源在谈推荐理由:NVIDIA的OpenShell更新了,新增双向流和认证支持原文
13:12NVIDIA AI@NVIDIAAINVIDIA AI 官方账号宣布,基于 DGX Spark 的 Stelline 开发者套件已开始向科学家发货。该套件由 Luigi Cruz 团队开发,旨在将 GPU 加速信号处理引入射电天文学领域,使研究人员能在本地开发计算和网络能力,再部署到天文台。首批设备已交付给科学家,标志着 GPU 加速信号处理在射电天文学中的实际应用迈出重要一步。AI产品NVIDIAGPU加速射电天文学Stelline开发套件信号处理推荐理由:射电天文学研究者终于有了专用的 GPU 加速开发平台,Stelline 套件让本地开发到天文台部署的流程更顺畅,做信号处理或天文计算的团队值得关注。原文
12:55NVIDIA AI@NVIDIAAINVIDIA AI 高管在社交平台分享了一次令人惊叹的本地 AI 体验:他仅通过手机向本地运行的 121B 模型(DGX Spark)提问,Hermes 智能体便自主完成了 8 个测试用例,全部通过。整个过程无需编写一行代码,完全由模型自主完成。这展示了大型模型本地部署的潜力,意味着开发者未来可能只需描述需求,AI 就能自动完成测试、调试等任务。AI产品NVIDIADGX SparkHermes 智能体本地部署自主测试推荐理由:本地运行 121B 模型并自主完成测试,这对追求隐私和低延迟的开发者来说是个震撼的 demo——你只需提问,AI 就能搞定一切,建议点开看看未来已来的样子。原文
14:01AK@_akhaliqNVIDIA 在 Hugging Face 上发布了 AnyFlow,这是首个任意步数视频扩散模型。它能够根据文本描述生成高质量视频,且支持在推理时灵活调整步数,无需重新训练。该模型在视频质量和生成效率上取得了平衡,为视频生成领域带来了新的可能性。开发者可以直接在 Hugging Face 上获取模型权重和使用示例。AI模型NVIDIAAnyFlow视频扩散模型Hugging Face文本生成视频推荐理由:做视频生成或扩散模型研究的开发者,现在有了一个无需重新训练就能灵活控制生成步数的工具,值得上手试试。原文
07:26NVIDIA AI@NVIDIAAINVIDIA 推出了基于技能的 Video Analytics AI Agent,允许开发者通过组合预定义技能(如目标检测、跟踪、行为识别)快速构建视频分析应用。该 Agent 架构支持自然语言指令调用技能,无需手动编程,大幅降低视频 AI 开发门槛。NVIDIA 表示这将加速零售、安防、制造等行业的视频智能部署。AI产品NVIDIA视频分析智能体技能AI Agent推荐理由:做视频分析的团队终于可以像搭积木一样构建 AI 应用了——NVIDIA 把复杂技能封装成可调用模块,用自然语言就能编排,建议做安防或零售的开发者点开看看。原文