AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:GB300×
6月30日
11:33
11:33IT之家(博客/媒体)
72°
微软在Microsoft Foundry平台推出托管于Azure云服务的Anthropic Claude模型,硬件基于NVIDIA GB300 NVL72机架与Quantum-X800 InfiniBand互联。首批提供Claude Opus 4.8和Claude Haiku 4.5两个模型,支持提示缓存和扩展思维功能。该服务覆盖编程、代理式工作流及复杂推理等用例,并接入Azure生态系统。NVIDIA还为此服务提供智能体技能与安全智能体工作区参考设计。
AI产品ClaudeAzure英伟达GB300云服务

推荐理由:微软在Azure上直接跑Claude Opus 4.8和Haiku 4.5了,还带NVIDIA GB300硬件加速,写代码搞代理都能用,需要云上Claude的直接冲。
原文
6月25日
11:36
11:36AI Will@FinanceYF5
Reflection 与 SpaceX 签署了一项价值 63 亿美元的算力协议。根据协议,Reflection 将立即获得 GB300 资源用于训练开源模型,并从 2026 年 7 月 1 日起至 2029 年每月向 SpaceX 支付 1.5 亿美元。该协议由 CNBC 首次披露,涉及 SpaceX 在 AI 算力领域的重大商业合作。
行业SpaceXReflection算力协议GB300开源模型

推荐理由:SpaceX 和 Reflection 签了 63 亿美元的大单,提供 GB300 算力给训练开源模型,从 2026 年每月付 1.5 亿,挺大的动静。
原文
6月24日
01:02
01:02LMSYS Org (SGLang)@lmsysorg
79°
与NVIDIA合作,在GB300上使用SGLang服务DeepSeek-V4,实现5倍吞吐量提升(~2,200→~11,200 tok/s/GPU,交互性~50 tok/s/user)。借助MTP,在80 tok/s/user交互性下吞吐再提升2.6倍。Blackwell Ultra聚合模式下30 tok/s/user时吞吐提升2.91倍,峰值无MTP吞吐提升超6倍。采用W4A4 MegaMoE量化(MXFP4)且精度损失可忽略。单个FP8-einsum修复将MTP接受率从0.57提至0.70。
AI模型DeepSeek-V4GB300SGLang推理优化NVIDIA

推荐理由:想用SGLang在GB300上榨干DeepSeek-V4?NVIDIA合作实测,吞吐翻5倍,交互延迟不变,MTP和量化细节全公开。
原文
6月23日
11:38
11:38techcrunch@Kirsten Korosec
Reflection AI与SpaceX签订为期三年半的算力协议,从2026年7月1日至2029年,每月支付1.5亿美元,换取Nvidia最新GB300 AI芯片及配套硬件在SpaceX位于田纳西州孟菲斯的Colossus 2数据中心的使用权。该交易总额约63亿美元。Reflection AI是一家开源AI实验室,此举将获得大规模算力支撑模型训练。
行业SpaceXReflection AINvidiaGB300算力交易

推荐理由:SpaceX把自家数据中心算力卖给Reflection AI,每月1.5亿刀用三年半,规模够大。
原文
6月22日
23:24
23:24IT之家(博客/媒体)
SpaceX与开源AI初创公司Reflection AI签署算力合作协议,最高价值63亿美元(约427.71亿元人民币)。根据协议,Reflection将立即获得英伟达GB300 AI芯片使用权,用于训练和运行高级模型。Reflection同意从2026年7月1日至2029年底每月向SpaceX支付1.5亿美元(约10.18亿元人民币)。合约生效满三个月后,任意一方可提前90天终止。Reflection是开源AI企业,尚未发布前沿级模型,但参与美国能源部创世纪计划和五角大楼AI计划。
行业SpaceXReflection AIGB300开源模型算力合作

推荐理由:SpaceX签了个63亿美元的大单,和开源AI公司Reflection合作,对方能用上英伟达GB300芯片,行业风向标啊。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
精选全部日报登录