H100 · AI 话题观测

§ 01综述

H100 是英伟达于2022年发布的Hopper架构GPU，专为大规模AI训练和推理设计，凭借其Transformer引擎和高速互联，长期占据高端AI芯片市场的主导地位。其算力峰值达1979 TFLOPS（FP8），但近期面临自研芯片和竞争产品的挑战。

H100 近期进展

2026年7月，英伟达推出压缩混合MoE模型Nemotron-Labs-3-Puzzle-75B-A9B，通过架构优化在保持模型质量的同时将吞吐量提升2.03倍，可有效降低H100等GPU的推理成本。原文标题

2026年7月，Meta推出基于GPU的计算服务，通过向外部客户出租H100等算力实现盈利，此举进一步印证了H100在云服务市场中的核心地位。原文标题

2026年7月，WAIC 2026大会聚焦超节点与光互连技术，探讨如何突破单芯片算力天花板，暗示H100的算力增长已接近物理极限，未来需依赖系统级创新。原文标题

2026年6月，SpaceX在IPO后表示将深化与英伟达的合作，强调H100在航天AI模拟中的关键作用，凸显其在高端计算场景的不可替代性。原文标题

当前焦点与观察点

当前H100的焦点主要集中在三方面：一是英伟达通过软件优化（如MoE模型压缩）延长H100的实用寿命，降低用户成本；二是云计算厂商（如Meta）将H100作为盈利工具，反映其市场需求依然旺盛；三是来自国产芯片（如每秒520万亿次浮点运算的自研芯片）和新兴互联技术（光互连、超节点）的竞争压力增大。整体看，H100在短期内仍是AI算力的标杆，但长期面临架构迭代和替代方案的双重挑战。

§ 02相关报道10 条在档

§ 03邻近话题