全部 AI 动态 · AI 热点

6月30日

11:33

11:33IT之家（博客/媒体）

72°

微软在Microsoft Foundry平台推出托管于Azure云服务的Anthropic Claude模型，硬件基于NVIDIA GB300 NVL72机架与Quantum-X800 InfiniBand互联。首批提供Claude Opus 4.8和Claude Haiku 4.5两个模型，支持提示缓存和扩展思维功能。该服务覆盖编程、代理式工作流及复杂推理等用例，并接入Azure生态系统。NVIDIA还为此服务提供智能体技能与安全智能体工作区参考设计。

AI产品 Claude Azure 英伟达 GB300 云服务

推荐理由：微软在Azure上直接跑Claude Opus 4.8和Haiku 4.5了，还带NVIDIA GB300硬件加速，写代码搞代理都能用，需要云上Claude的直接冲。

6月25日

11:36

11:36

AI Will@FinanceYF5

Reflection 与 SpaceX 签署了一项价值 63 亿美元的算力协议。根据协议，Reflection 将立即获得 GB300 资源用于训练开源模型，并从 2026 年 7 月 1 日起至 2029 年每月向 SpaceX 支付 1.5 亿美元。该协议由 CNBC 首次披露，涉及 SpaceX 在 AI 算力领域的重大商业合作。

行业 SpaceX Reflection 算力协议 GB300 开源模型

推荐理由：SpaceX 和 Reflection 签了 63 亿美元的大单，提供 GB300 算力给训练开源模型，从 2026 年每月付 1.5 亿，挺大的动静。

6月24日

01:02

01:02

LMSYS Org (SGLang)@lmsysorg

79°

与NVIDIA合作，在GB300上使用SGLang服务DeepSeek-V4，实现5倍吞吐量提升（~2,200→~11,200 tok/s/GPU，交互性~50 tok/s/user）。借助MTP，在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍，峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化（MXFP4）且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。

AI模型 DeepSeek-V4 GB300 SGLang 推理优化 NVIDIA

推荐理由：想用SGLang在GB300上榨干DeepSeek-V4？NVIDIA合作实测，吞吐翻5倍，交互延迟不变，MTP和量化细节全公开。

6月23日

11:38

11:38

techcrunch@Kirsten Korosec

Reflection AI与SpaceX签订为期三年半的算力协议，从2026年7月1日至2029年，每月支付1.5亿美元，换取Nvidia最新GB300 AI芯片及配套硬件在SpaceX位于田纳西州孟菲斯的Colossus 2数据中心的使用权。该交易总额约63亿美元。Reflection AI是一家开源AI实验室，此举将获得大规模算力支撑模型训练。

行业 SpaceX Reflection AI Nvidia GB300 算力交易

推荐理由：SpaceX把自家数据中心算力卖给Reflection AI，每月1.5亿刀用三年半，规模够大。

6月22日

23:24

23:24IT之家（博客/媒体）

SpaceX与开源AI初创公司Reflection AI签署算力合作协议，最高价值63亿美元（约427.71亿元人民币）。根据协议，Reflection将立即获得英伟达GB300 AI芯片使用权，用于训练和运行高级模型。Reflection同意从2026年7月1日至2029年底每月向SpaceX支付1.5亿美元（约10.18亿元人民币）。合约生效满三个月后，任意一方可提前90天终止。Reflection是开源AI企业，尚未发布前沿级模型，但参与美国能源部创世纪计划和五角大楼AI计划。

行业 SpaceX Reflection AI GB300 开源模型算力合作

推荐理由：SpaceX签了个63亿美元的大单，和开源AI公司Reflection合作，对方能用上英伟达GB300芯片，行业风向标啊。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？