07:25IT之家(博客/媒体)83°英伟达在MLPerf Training 6.0七项基准测试中全部夺魁,Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统,在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载,刷新了大规模训练效率纪录。AI模型NVIDIABlackwellDeepSeek-V3MLPerf训练基准9 个信源在谈推荐理由:英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟,比上代快60%,性能真狠。原文
10:37IT之家(博客/媒体)71°Tensordyne 发布 Napier 推理系统,宣称能效是 NVIDIA Blackwell 系统的 17 倍,吞吐量达 13 倍。Napier 采用对数数学设计简化乘法运算,由台积电 3nm 制程生产。TDN72 集成 72 颗芯片,机柜级系统可支持 1000 Token/s/user 的 LLM 推理。AI产品TensordyneNapierBlackwell推理芯片AI芯片4 个信源在谈推荐理由:Tensordyne 搞了个叫 Napier 的推理芯片,用对数数学省掉了乘法,据说比 NVIDIA Blackwell 快 13 倍,能耗还低 17 倍。初创敢叫板老黄,看看值不值。原文
11:20IT之家(博客/媒体)精选英伟达在 2026 台北电脑展上展示了 RTX Spark 平台,其 CPU 部分采用 10 个 Cortex-X925 和 10 个 Cortex-A725 核心,借鉴了联发科天玑 9400 和 8500 的设计。该平台基于台积电 3nm 工艺,GPU 为 Blackwell RTX 架构,拥有 6144 个 CUDA 核心,FP4 AI 性能达 1 PFLOP。支持最高 128GB LPDDR5X 统一内存,CPU-GPU 间 NVLink-C2C 带宽约 600GB/s。软件生态覆盖 CUDA、TensorRT、DLSS 等。这一设计旨在与英特尔、AMD、高通竞争 PC 芯片市场,标志着英伟达在 ARM PC 领域的重大布局。AI产品英伟达RTX SparkARM PC联发科Blackwell推荐理由:英伟达联手联发科打造 ARM PC 芯片,20 核设计直指英特尔和 AMD 的桌面市场,做高性能计算或 AI 开发的 PC 玩家值得关注这一新生态的潜力。原文