11:36AI Will@FinanceYF5Reflection 与 SpaceX 签署了一项价值 63 亿美元的算力协议。根据协议,Reflection 将立即获得 GB300 资源用于训练开源模型,并从 2026 年 7 月 1 日起至 2029 年每月向 SpaceX 支付 1.5 亿美元。该协议由 CNBC 首次披露,涉及 SpaceX 在 AI 算力领域的重大商业合作。行业SpaceXReflection算力协议GB300开源模型3 个信源在谈推荐理由:SpaceX 和 Reflection 签了 63 亿美元的大单,提供 GB300 算力给训练开源模型,从 2026 年每月付 1.5 亿,挺大的动静。原文
01:02LMSYS Org (SGLang)@lmsysorg79°与NVIDIA合作,在GB300上使用SGLang服务DeepSeek-V4,实现5倍吞吐量提升(~2,200→~11,200 tok/s/GPU,交互性~50 tok/s/user)。借助MTP,在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍,峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化(MXFP4)且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。AI模型DeepSeek-V4GB300SGLang推理优化NVIDIA8 个信源在谈推荐理由:想用SGLang在GB300上榨干DeepSeek-V4?NVIDIA合作实测,吞吐翻5倍,交互延迟不变,MTP和量化细节全公开。原文