03:09marktechpost@Asif Razzaq精选NVIDIA 开源了 BioNeMo Agent Toolkit,将 OpenFold3、DiffDock 和 GenMol 等生物分子模型包装为 AI 代理可直接调用的技能。每个技能包含模型用途、输入、输出和失败模式说明。在 NVIDIA 使用 Codex CLI 和 GPT-5.5 fast 的基准测试中,该工具将任务完成率从 57.1% 提升至 100%,并实现 token 效率翻倍。AI产品NVIDIABioNeMo Agent ToolkitOpenFold3DiffDock药物发现3 个信源在谈推荐理由:NVIDIA 开源了这个工具,让 AI 代理能直接调用分子模型做药物发现。用上它任务完成率翻倍还省 Token,做生物计算的同学可以试试。原文
09:39IT之家(博客/媒体)精选78°澳大利亚云服务商 Firmus 宣布在印尼峇淡建设一座 360MW 的 AI 工厂,采用 NVIDIA DSX 液冷方案。该工厂由 Firmus 与 DayOne 合作开发,电力容量达 360MW。根据与 NVIDIA 至 2034 年的战略合作,NVIDIA 将在明后两年交付 Grace Blackwell、Vera Rubin、Vera 等多代算力硬件,总计 17 万颗 GPU。Firmus 预计前六年从已承诺承购协议中获得 250~300 亿美元收入。NVIDIA 还是 Firmus 今年四月股权融资的有条件参与方。行业NVIDIAFirmusAI工厂Grace BlackwellVera Rubin6 个信源在谈推荐理由:想了解超大规模 AI 数据中心怎么建?Firmus 联手 NVIDIA 在印尼搞了个 360MW 的大项目,17 万颗 GPU,仅硬件收入就有 300 亿美元,值得一读。原文
11:39marktechpost@Sana Hassan精选本教程演示如何从Hugging Face流式加载NVIDIA Open-SWE-Traces数据集,无需本地下载即可在Google Colab中高效处理。内容涵盖多轮智能体对话标准化、代码补丁解析、构建包含轨迹长度、工具使用次数、补丁大小、语言分布及解决结果的分析DataFrame。最后基于成功标签、Token限制、语言过滤和补丁可用性筛选出监督微调子集。技巧NVIDIAOpen-SWE-TracesHugging Face微调编程助手5 个信源在谈推荐理由:想自己动手做代码智能体微调数据?这教程手把手教你解析NVIDIA开源的Open-SWE-Traces,连Token预算和工具使用指标都算好了。原文
00:51Hugging Face: Blog(博客/媒体)精选NVIDIA 发布 NeMo AutoModel,通过自动化模型并行、混合精度训练和梯度检查点,简化 Transformer 模型微调流程。该工具可自动检测硬件配置,支持多 GPU 分布式训练,无需手动调整参数。在微调 BERT-base 模型时,相比标准 PyTorch 实现,NeMo AutoModel 将训练时间缩短约 40%,并保持相同精度。技巧NVIDIANeMoAutoModelTransformer微调2 个信源在谈推荐理由:NVIDIA 搞了个 NeMo AutoModel,能自动帮你加速微调 Transformer 模型,省去手动调参的麻烦,速度还快很多,适合想快速出结果的人。原文
09:58Pandaily@contact@pandaily.com (Pandaily)NVIDIA、高通等芯片巨头正在加码具身AI芯片赛道。多家公司发布了针对人形机器人等应用的专用芯片方案。市场争夺日趋白热化,各厂商正通过差异化设计和生态合作抢占先机。行业NVIDIAQualcomm具身智能芯片市场动态8 个信源在谈推荐理由:NVIDIA和高通都在押注具身AI芯片,看看他们谁能笑到最后。原文
15:58IT之家(博客/媒体)Valve 发布了 SteamOS 3.8 版本,但目前仅支持 AMD 的 GPU。Valve 员工 Pierre-Loup Griffais 在接受 The Verge 采访时透露,团队正在为 SteamOS 开发 NVIDIA 显卡驱动程序支持,并与 NVIDIA 密切合作。虽然该支持可能不会在今年推出,但 Valve 已将其列为幕后重点方向。行业ValveSteamOSNVIDIA显卡兼容Linux游戏7 个信源在谈推荐理由:Valve 官方确认 SteamOS 正在开发 N 卡支持,虽然今年可能出不来,但这是 Linux 游戏平台的关键一步。原文
10:23Pandaily@contact@pandaily.com (Pandaily)72°Intel的CPU复苏、Broadcom的定制ASIC扩张以及云巨头自研芯片正重塑AI算力格局。这些挑战者试图从不同角度分食NVIDIA在AI训练和推理市场的份额。具体包括Intel的Xeon处理器提升AI性能,Broadcom为谷歌等客户设计的TPU持续迭代,以及亚马逊Trainium、谷歌TPU等云自研芯片逐步规模化。行业NVIDIAIntelBroadcomAI芯片算力竞争8 个信源在谈推荐理由:Intel、Broadcom和云巨头都在动NVIDIA的蛋糕,这篇梳理了各家具体动作,让你看清AI芯片战局。原文
09:48IT之家(博客/媒体)76°NVIDIA 宣布 Vera Rubin NVL4 平台将于 2026Q4 上市。该平台集成 4 颗 Rubin GPU 和 2 颗 Vera CPU,采用第六代 NVLink 协议和 NVLink-C2C 互连。与 Grace Hopper 相比,其科学计算模拟性能提升 4 倍,科学 AI 训练性能提升 6 倍,科学 AI 推理性能提升 8 倍。系统兼容液冷 NVIDIA MGX 模块化服务器,专为现代超级计算优化。AI产品NVIDIAVera RubinNVL4Grace Hopper超级计算4 个信源在谈推荐理由:NVIDIA 发了 Vera Rubin NVL4,2026 年底上市,科学计算比 Grace Hopper 快 4 倍,AI 训练快 6 倍,搞超算和 AI 的可以盯一下。原文
10:23IT之家(博客/媒体)鸿海董事长刘扬伟6月18日在台湾地区工商协进会会员大会上表示,基于NVIDIA Vera Rubin平台打造1GW规模的AI数据中心需要470亿美元资本支出。单一个Vera Rubin机架价格为910万美元,1GW数据中心共需约3557个各类机架。每年电力支出达13亿美元,硬件折旧费用为电力成本的六倍。刘扬伟援引外部数据预测,全球数据中心产业规模到2030年将达1.6万亿美元,电力容量将从2024年的68GW增至174GW。行业Vera RubinNVIDIA英伟达数据中心资本支出5 个信源在谈推荐理由:刘扬伟算了笔账:建1GW的Vera Rubin数据中心要470亿美元,单机柜910万,电费一年13亿。想了解AI数据中心的真实成本?看这篇。原文
06:57marktechpost@Asif RazzaqNVIDIA AI推出了SpatialClaw,这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行,将代码作为动作接口。SpatialClaw能够组合多种感知工具,实现3D空间推理。这种设计免去了传统微调或训练步骤。AI模型SpatialClawNVIDIAPython智能体3D空间推理2 个信源在谈推荐理由:NVIDIA搞了个叫SpatialClaw的智能体,不用训练,直接用写Python代码的方式做3D空间推理,挺创新的。原文
18:19pandaily@contact@pandaily.com (Pandaily)73°Coherent、Nokia、JX Advanced Metals 等全球光芯片厂商宣布扩大产能,以满足AI数据中心对高速互联的需求。NVIDIA 为此投资20亿美元,锁定光子互连供应链。这些扩产计划预计在2026年前完成,以支撑下一代AI网络架构。行业CoherentNokiaJX Advanced MetalsNVIDIA光芯片AI数据中心4 个信源在谈推荐理由:光芯片是AI数据中心的血管,英伟达砸20亿锁定供应,可以了解一下三巨头各自的扩产计划原文
09:39marktechpost@Sana Hassan精选本教程演示如何使用 NVIDIA SkillSpector 对 AI 技能进行安全风险预部署扫描。通过构建良性和故意含漏洞的技能语料库,利用 SkillSpector 的 LangGraph 工作流进行扫描,并用 pandas 整理风险评分与发现。结果导出为 SARIF 格式,支持自定义分析器和可选的 LLM 语义分析。该流程覆盖静态分析、风险分类可视化及报告生成。技巧NVIDIASkillSpectorSARIFAI安全静态分析1 个信源在谈推荐理由:NVIDIA 教你用 SkillSpector 做 AI 技能安全扫描,从写语料到出 SARIF 报告,一步一步都有代码,适合想加固 AI 应用的开发者。原文
07:25IT之家(博客/媒体)83°英伟达在MLPerf Training 6.0七项基准测试中全部夺魁,Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统,在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载,刷新了大规模训练效率纪录。AI模型NVIDIABlackwellDeepSeek-V3MLPerf训练基准9 个信源在谈推荐理由:英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟,比上代快60%,性能真狠。原文
19:30pandaily@contact@pandaily.com (Pandaily)NVIDIA拉丁美洲负责人否认Anthropic关于该地区成为受限AI芯片流入中国渠道的指控。该负责人同时表达了对美国出口管制政策的不满。Anthropic此前指控称,部分受限芯片通过拉丁美洲转运至中国。NVIDIA强调其遵守所有出口法规,并否认存在违规行为。行业NVIDIAAnthropic芯片出口管制拉丁美洲AI芯片10 个信源在谈推荐理由:NVIDIA正面回应芯片走私指控原文
04:44Simon Willison’s Weblog(博客/媒体)76°Google 去年曾短暂发布实验性的 Gemini Diffusion 模型,如今以开源形式回归,推出 DiffusionGemma-26B-A4B-it 模型,采用 Apache 2 许可证。该模型在 NVIDIA NIM 云 API 上免费托管,生成速度可达 500+ tokens/秒。作者实测生成 2409 tokens 仅需 4.4 秒,性能出色。这是 Google 在扩散模型领域的重要开源动作,为开发者提供了高性能的生成式 AI 选项。AI模型GoogleDiffusionGemma开源/仓库NVIDIA生成式AI10 个信源在谈推荐理由:Google 把去年惊艳的扩散模型开源了,做图像/文本生成的开发者可以直接用 NVIDIA 免费 API 体验,速度超 500 tokens/秒,值得立刻上手试。原文
12:55marktechpost@Sana Hassan精选本文教程展示了如何从 NVIDIA 的 Nemotron-Pretraining-Code-v3 数据集中构建代码数据集管道。通过流式处理而非下载整个数据集,检查其模式并构建可管理的样本。分析了语言、文件扩展名、仓库频率和目录深度等元数据索引结构。然后重构原始 GitHub URL,获取真实源文件,并使用 tiktoken 估算获取代码的 token 规模。该方法适用于大规模代码预训练研究的数据处理。论文NVIDIANemotron-Pretraining-Code-v3代码数据集流式处理tiktoken9 个信源在谈推荐理由:做代码预训练或大规模数据处理的研究人员可以直接复用这套管道,省去下载和解析海量元数据的麻烦,值得一试。原文
10:31IT之家(博客/媒体)78°Cadence 在 COMPUTEX 2026 上宣布,其 ChipStack AI Super Agent 在 NVIDIA 支持下达到 Level-5 自主水平,成为业界首款全自主芯片设计 AI 虚拟工程师。该智能体基于 Cadence AI 驱动 EDA 产品组合和 NVIDIA Nemotron 模型构建,由 NVIDIA OpenShell 沙箱提供安全保障。它能独立执行复杂的芯片设计和验证工作流程,无需逐步提示,可评估中间结果并自主决策,覆盖规格理解、RTL 生成、验证规划等任务。这标志着芯片设计从 AI 辅助工程师向自主虚拟工程师的跨越,将显著提升资深工程师的设计效率和信心。AI产品芯片设计自主智能体CadenceNVIDIAEDA7 个信源在谈推荐理由:芯片设计团队终于有了能独立干活的 AI 虚拟工程师——ChipStack 从辅助进化为自主执行,做复杂芯片验证的工程师可以直接用它加速迭代,值得点开了解。原文
09:06IT之家(博客/媒体)韩国SK电讯宣布将基于NVIDIA的AI工厂平台DSX建设AI数据中心,目标将AI云服务规模扩展至GW级别。初期采用Blackwell架构GPU,后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运,并计划扩展至整个亚洲,成为亚洲领先的AI云提供商。此外,双方还在机器人仿真和训练平台方面展开合作。行业AI云数据中心NVIDIASK电讯基础设施7 个信源在谈推荐理由:SK电讯的GW级AI云计划标志着电信运营商正式切入AI基础设施赛道,对关注亚洲AI云市场、数据中心建设的从业者来说,这是一个值得跟踪的行业信号。原文
15:55marktechpost@Asif Razzaq精选NVIDIA发布了Nemotron 3.5 ASR,一个600M参数的流式语音识别模型。该模型采用cache-aware架构,可从单个检查点实时转录40种语言-区域。它针对低延迟场景优化,支持多种语言的实时语音转文字。AI模型Nemotron 3.5 ASRNVIDIA语音识别流式模型多语言10 个信源在谈推荐理由:600M模型转40语言实时原文
19:18marktechpost@Asif RazzaqNVIDIA 推出了 Dynamo Snapshot,这是一个基于 CRIU 和 cuda-checkpoint 工具的系统,用于在 Kubernetes 上对 vLLM 推理工作节点进行快照和恢复。该系统能够显著加速 AI 推理服务的启动时间,解决冷启动延迟问题。通过保存和恢复推理工作节点的状态,Dynamo Snapshot 使得在 Kubernetes 集群中快速扩缩容成为可能,尤其适用于需要频繁调整推理资源的场景。这一工具对于部署大规模 AI 推理服务的团队来说,可以提升资源利用率和响应速度。AI产品NVIDIADynamo SnapshotKubernetesAI推理CRIU9 个信源在谈推荐理由:NVIDIA 用 CRIU 快照解决了 Kubernetes 上 AI 推理的冷启动痛点,做模型推理部署的团队可以直接用这个工具来加速扩缩容,值得关注。原文
05:48marktechpost@Asif Razzaq83°NVIDIA 发布了 Nemotron 3 Ultra,一个 550B 总参数(55B 激活)的开放混合专家模型,采用 Mamba-Transformer 混合架构。该模型支持 100 万 token 的上下文窗口,推理吞吐量比同等精度的开放 LLM 高约 6 倍。NVIDIA 同时开源了模型权重、训练数据和配方,遵循 OpenMDW-1.1 许可。这一发布旨在解决长时运行智能体在推理效率和上下文长度上的瓶颈,为 AI 代理和复杂任务自动化提供了更高效的基础模型。AI模型NVIDIANemotron 3 Ultra混合专家模型长上下文智能体10 个信源在谈推荐理由:长时智能体开发者终于有了一个兼顾超长上下文和高推理效率的开放模型——Nemotron 3 Ultra 的 6 倍吞吐量提升能显著降低部署成本,做 Agent 或 RAG 系统的团队值得直接试。原文
04:32Hugging Face: Blog(博客/媒体)NVIDIA 推出 Nemotron 3.5 Content Safety,这是一款面向全球企业 AI 的可定制多模态安全模型。它支持文本和图像输入,能够检测有害内容(如仇恨言论、暴力、色情等),并允许企业根据自身政策进行微调。该模型基于 Llama 3.1 架构,提供 8B 和 70B 两种规模,在多个安全基准上表现优异。Nemotron 3.5 旨在帮助企业安全部署生成式 AI,满足不同地区的合规要求。AI模型NVIDIANemotron 3.5内容安全多模态企业AI10 个信源在谈推荐理由:企业部署 AI 最头疼的就是内容安全合规,NVIDIA 这个模型直接让企业按自己的政策微调安全过滤规则,做 AI 应用落地的团队值得关注。原文
22:32Hugging Face: Blog(博客/媒体)NVIDIA 发布了 Nemotron 3.5 ASR 模型的微调指南,帮助开发者将通用语音识别模型适配到特定语言、专业领域或口音。该模型基于 Whisper 架构优化,支持低资源语言和噪声环境。指南提供了从数据准备、训练配置到部署的完整流程,并强调使用 LoRA 等高效微调方法降低计算成本。这对于需要高精度语音识别的垂直场景(如医疗、金融、客服)尤其有价值。AI模型语音识别ASRNemotron微调NVIDIA10 个信源在谈推荐理由:NVIDIA 把 ASR 微调的门槛降下来了,做语音应用的团队(尤其是非英语场景或专业领域)可以直接参考这套流程,省去大量试错成本。原文
20:32Hugging Face: Blog(博客/媒体)精选NVIDIA 提出了一种名为 Task-Seeded Synthetic Q&A Generation 的方法,用于为 Nemotron 模型预训练生成高质量的合成问答数据。该方法通过任务种子(task seeds)引导生成多样化的问答对,解决了传统数据生成中覆盖不足和多样性低的问题。实验表明,使用该方法生成的合成数据训练的模型在多个基准测试上表现优异,甚至优于使用真实数据训练的模型。这项技术有望降低对人工标注数据的依赖,加速大语言模型的开发。论文NVIDIANemotron合成数据预训练问答生成10 个信源在谈推荐理由:NVIDIA 用任务种子生成合成数据,解决了预训练数据稀缺和多样性不足的问题,做 NLP 和模型训练的团队可以关注,能显著降低数据标注成本。原文
10:08pandaily@contact@pandaily.com (Pandaily)83°在NVIDIA GTC Taipei 2026上,一家中国具身智能公司宣布其模型在RoboArena基准测试中排名第一,超越了NVIDIA和Physical Intelligence等国际巨头。RoboArena是评估机器人自主决策和操作能力的权威基准,涵盖多种复杂任务。这一成就标志着中国在具身智能领域取得重大突破,展示了其技术实力和创新能力。该公司的模型在任务完成率、适应性和效率等关键指标上表现优异,为行业树立了新标杆。行业具身智能RoboArenaNVIDIAPhysical Intelligence基准测试7 个信源在谈推荐理由:具身智能赛道迎来中国玩家登顶,做机器人或AI应用的团队值得关注——这不仅是技术突破,更可能改变行业竞争格局。原文
08:57IT之家(博客/媒体)精选微软 Surface RTX Spark Dev Box 是一款面向本地 AI 开发的紧凑型桌面设备,专为模型微调、本地推理和智能体工作流设计。该设备搭载 NVIDIA Grace CPU 和 Blackwell RTX GPU,拥有 128GB 统一内存,AI 算力高达 1 Petaflop,可本地运行 120B 参数模型。其铝制外壳覆盖约 1000 个散热孔,兼顾散热与结构设计,整机功耗仅 100W。系统预装开发者优化版 Windows 11 Pro,并配置了 VS Code、GitHub Copilot、WSL 2 等开发工具,旨在减少环境搭建时间。该设备将于今年晚些时候发售。AI产品微软Surface RTX Spark Dev BoxAI 开发机本地推理NVIDIA10 个信源在谈推荐理由:本地跑 120B 模型终于有正经硬件了——Surface RTX Spark Dev Box 把 AI 开发环境打包成 100W 的桌面盒子,做模型微调或智能体开发的团队可以直接关注,省去搭服务器和配环境的麻烦。原文
16:41marktechpost@Asif Razzaq83°NVIDIA 发布了 Cosmos 3,这是一款开源的“全模态世界模型”,采用双塔混合 Transformer 架构,将自回归 VLM 推理器与扩散生成器结合。该模型能够统一物理推理、世界生成和动作生成,为物理 AI 提供基础能力。Cosmos 3 旨在让机器人、自动驾驶等系统更好地理解物理世界并生成合理动作。其开源特性有望加速物理 AI 领域的研究与应用开发。AI模型NVIDIACosmos 3物理 AI世界模型开源/仓库10 个信源在谈推荐理由:NVIDIA 把物理推理和世界生成塞进一个开源模型,做机器人或自动驾驶的团队可以直接拿来用,省去从头训练物理世界模型的成本。原文
14:33Hugging Face: Blog(博客/媒体)83°NVIDIA 发布了 Cosmos 3,这是首个开源的物理 AI 全能模型,能够同时进行推理和行动。该模型基于多模态输入(如视觉、语言)理解物理世界,并生成可执行的动作序列。Cosmos 3 在机器人、自动驾驶等需要物理交互的领域具有重大意义,因为它将感知、推理和行动整合在一个模型中。NVIDIA 在 Hugging Face 上开源了该模型,开发者可以直接使用或微调。AI模型物理 AI开源/仓库NVIDIA机器人自动驾驶9 个信源在谈推荐理由:做机器人或自动驾驶的开发者终于有了一个开源的物理世界理解模型,能直接推理并生成动作,省去多模型拼接的麻烦,值得立即上手试试。原文
09:05IT之家(博客/媒体)精选76°戴尔向CoreWeave交付了全球首套可运行的NVIDIA Vera Rubin NVL72 AI超级计算机系统,并已通过所有测试。该系统基于戴尔PowerEdge XE9812液冷服务器,集成72个Rubin GPU和36颗Vera CPU,支持T级参数超大规模AI模型和MoE模型训练,同时在大规模AI推理中降低单位Token成本。CoreWeave计划从2026年下半年开始将基于Rubin的系统集成至其AI云平台。这标志着NVIDIA下一代AI计算架构首次落地实际部署,对超大规模AI训练和推理效率有重要影响。AI产品NVIDIAVera Rubin戴尔AI超级计算机液冷服务器10 个信源在谈推荐理由:这是NVIDIA Rubin架构首次实际落地,做超大规模AI训练和推理的团队可以关注其单位Token成本降低的潜力,建议点开了解具体配置和部署时间线。原文
07:24marktechpost@Asif RazzaqNVIDIA 提出 X-Token,一种投影引导的跨分词器知识蒸馏(KD)方法,解决了 GOLD 方法中的两个结构性缺陷。在 Llama-3.2-1B 模型上,X-Token 将 GSM8k 准确率从 2.56% 提升至 15.54%,并在多个基准测试中平均超越 GOLD 3.82 分。该方法通过投影层对齐教师和学生模型的分词器,实现了更有效的知识迁移。X-Token 为小模型蒸馏大模型知识提供了新思路,尤其适用于资源受限场景。论文知识蒸馏NVIDIALlama-3.2-1BGSM8k跨分词器6 个信源在谈推荐理由:X-Token 解决了知识蒸馏中分词器不匹配的痛点,做模型压缩或边缘部署的团队可以直接用这个思路提升小模型推理能力,值得关注。原文
15:52IT之家(博客/媒体)精选戴尔在 COMPUTEX 2026 新闻资料袋中预告将推出基于 NVIDIA "N1X" 芯片的 XPS 机型,相关信息将于北京时间 6 月 1 日 11:00 解禁。此前联想 "N1X" 版 YOGA 360 16 已通过 3C 认证,两家 OEM 动作指向 NVIDIA 将在 COMPUTEX 2026 正式发布 "N1X" SoC。泄露信息显示 "N1X" 与 DGX Spark 的 GB10 同源,采用 20 核 Arm CPU + 6144 CUDA GPU 组合,支持 256-bit LPDDR5x 内存。AI产品N1XXPSDellNVIDIA电脑展5 个信源在谈推荐理由:戴尔XPS要上N1X芯片了原文
01:12marktechpost@Asif Razzaq76°NVIDIA 研究人员推出 Polar,一个 token 忠实展开框架,用于通过强化学习训练语言智能体,无需修改其智能体框架。Polar 在框架和推理服务器之间放置模型 API 代理,捕获 token 级交互并重建训练器就绪轨迹。基于 Qwen3.5-4B 基础模型使用 GRPO,Polar 在 Codex 框架下将 SWE-Bench Verified pass@1 提升 22.6 个百分点,在 Claude Code 下提升 4.8 个百分点,在 Pi 下提升 6.2 个百分点。该框架已注册为 NeMo Gym 环境,并在 ProRL Agent Server 仓库中发布。AI模型NVIDIAPolarGRPO代码智能体强化学习4 个信源在谈推荐理由:Polar 解决了 RL 训练智能体时需修改框架的痛点,做代码智能体或 RL 训练的开发者可以直接集成,无需改动现有工具链,值得一试。原文
15:43marktechpost@Asif Razzaq精选70°NVIDIA 发布 Gated DeltaNet-2,一种线性注意力层,将 Delta 规则中的擦除和写入操作解耦为通道级擦除门 b_t 和写入门 w_t。在 1.3B 参数、100B FineWeb-Edu 令牌训练下,它在语言建模、常识推理和长上下文检索任务上超越 Mamba-2、Gated DeltaNet、KDA 和 Mamba-3。最大提升出现在 RULER S-NIAH 和多键针检索基准上。AI模型大模型推理模型MambaNVIDIA线性注意力4 个信源在谈推荐理由:NVIDIA 新线性注意力,解耦擦写门原文
09:53Hugging Face: Blog(博客/媒体)精选NVIDIA 发布了 Nemotron-Labs 扩散语言模型,该模型采用扩散机制替代传统的自回归生成方式,大幅提升文本生成速度,接近光速。与 GPT-4 等模型相比,Nemotron-Labs 在保持生成质量的同时,推理速度提升了一个数量级。该模型在多个基准测试中表现出色,尤其适合需要低延迟的实时应用场景。这一突破可能改变大语言模型的部署范式,让文本生成更接近实时交互。AI模型扩散模型文本生成NVIDIA推理加速Nemotron-Labs2 个信源在谈推荐理由:NVIDIA 的扩散语言模型将文本生成速度推向新高度,做实时对话或低延迟应用的开发者可以直接关注,它可能改变你对大模型推理速度的认知。原文
08:03IT之家(博客/媒体)联想发布 ThinkStation P4 工作站,全球首款同时搭载 AMD 锐龙 Pro 9000 系列处理器与 NVIDIA RTX Pro 6000 Blackwell GPU 的产品。该工作站首次在专业市场引入 AMD 3D V-Cache 技术,能在数据密集型应用中提升性能。整机最高支持 256GB DDR5 内存、液冷散热,并获得多家主流 ISV 认证,面向工程师、设计师等专业用户。行业大模型AMDNVIDIA工作站AI算力推荐理由:AMD 3D V-Cache 首次进入专业工作站领域,结合 NVIDIA 最新 Blackwell GPU,为 AI 和高负载专业应用提供新选择。原文
06:17OpenAI Blog(博客/媒体)OpenAI发布了与NVIDIA工程师和研究人员的合作案例,展示了Codex结合GPT-5.5如何帮助团队构建生产系统并将研究想法快速转化为可运行的实验。该工具显著提升了代码生成和实验迭代效率。这表明AI辅助开发正从原型阶段进入规模化生产应用。AI产品编程助手代码生成NVIDIAGPT-5.5研发效率10 个信源在谈推荐理由:典型案例揭示了AI编程助手在大型企业研发流程中的实际应用价值,对评估AI辅助工具在工业界的落地效果有参考意义。原文