11:33IT之家(博客/媒体)72°微软在Microsoft Foundry平台推出托管于Azure云服务的Anthropic Claude模型,硬件基于NVIDIA GB300 NVL72机架与Quantum-X800 InfiniBand互联。首批提供Claude Opus 4.8和Claude Haiku 4.5两个模型,支持提示缓存和扩展思维功能。该服务覆盖编程、代理式工作流及复杂推理等用例,并接入Azure生态系统。NVIDIA还为此服务提供智能体技能与安全智能体工作区参考设计。AI产品ClaudeAzure英伟达GB300云服务推荐理由:微软在Azure上直接跑Claude Opus 4.8和Haiku 4.5了,还带NVIDIA GB300硬件加速,写代码搞代理都能用,需要云上Claude的直接冲。原文
11:36AI Will@FinanceYF5Reflection 与 SpaceX 签署了一项价值 63 亿美元的算力协议。根据协议,Reflection 将立即获得 GB300 资源用于训练开源模型,并从 2026 年 7 月 1 日起至 2029 年每月向 SpaceX 支付 1.5 亿美元。该协议由 CNBC 首次披露,涉及 SpaceX 在 AI 算力领域的重大商业合作。行业SpaceXReflection算力协议GB300开源模型3 个信源在谈推荐理由:SpaceX 和 Reflection 签了 63 亿美元的大单,提供 GB300 算力给训练开源模型,从 2026 年每月付 1.5 亿,挺大的动静。原文
01:02LMSYS Org (SGLang)@lmsysorg79°与NVIDIA合作,在GB300上使用SGLang服务DeepSeek-V4,实现5倍吞吐量提升(~2,200→~11,200 tok/s/GPU,交互性~50 tok/s/user)。借助MTP,在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍,峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化(MXFP4)且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。AI模型DeepSeek-V4GB300SGLang推理优化NVIDIA8 个信源在谈推荐理由:想用SGLang在GB300上榨干DeepSeek-V4?NVIDIA合作实测,吞吐翻5倍,交互延迟不变,MTP和量化细节全公开。原文
11:38techcrunch@Kirsten KorosecReflection AI与SpaceX签订为期三年半的算力协议,从2026年7月1日至2029年,每月支付1.5亿美元,换取Nvidia最新GB300 AI芯片及配套硬件在SpaceX位于田纳西州孟菲斯的Colossus 2数据中心的使用权。该交易总额约63亿美元。Reflection AI是一家开源AI实验室,此举将获得大规模算力支撑模型训练。行业SpaceXReflection AINvidiaGB300算力交易10 个信源在谈推荐理由:SpaceX把自家数据中心算力卖给Reflection AI,每月1.5亿刀用三年半,规模够大。原文
23:24IT之家(博客/媒体)SpaceX与开源AI初创公司Reflection AI签署算力合作协议,最高价值63亿美元(约427.71亿元人民币)。根据协议,Reflection将立即获得英伟达GB300 AI芯片使用权,用于训练和运行高级模型。Reflection同意从2026年7月1日至2029年底每月向SpaceX支付1.5亿美元(约10.18亿元人民币)。合约生效满三个月后,任意一方可提前90天终止。Reflection是开源AI企业,尚未发布前沿级模型,但参与美国能源部创世纪计划和五角大楼AI计划。行业SpaceXReflection AIGB300开源模型算力合作3 个信源在谈推荐理由:SpaceX签了个63亿美元的大单,和开源AI公司Reflection合作,对方能用上英伟达GB300芯片,行业风向标啊。原文