14:15IT之家(博客/媒体)哈萨比斯在戛纳创意节受访,回应谷歌AI人才流失质疑。他以Noam Shazeer(《Attention is All You Need》作者之一)为例,指出顶级研究员身价堪比明星运动员。哈萨比斯强调谷歌拥有庞大数据生态、整合硬件体系和大规模TPU集群,是训练下一代前沿模型的核心优势。2023年Google Brain与DeepMind合并后,统一架构进一步集中AI资源。行业DeepMind谷歌TPU哈萨比斯AI人才推荐理由:哈萨比斯亲自讲谷歌怎么留人:有TPU集群、海量数据,还有2023年合并后的统一架构,不是光画饼。原文
07:35IT之家(博客/媒体)据科技媒体 The Information 报道,谷歌正与三星晶圆代工部门洽谈,计划由三星 2nm 工艺代工其下一代 TPU v10 芯片的 I/O Die 部分。谷歌 TPU 与博通联合设计,计算引擎仍由台积电生产,而内存输入输出芯片可能转交三星。此前三星已为谷歌第七代 Ironwood TPU 提供超 60% 的 HBM 内存。若合作达成,谷歌可进一步降低 TPU 成本——其当前性能与英伟达 H100 相当,但成本已低约 80%。此举可能重塑 AI 半导体供应链格局,减少对单一代工厂的依赖。行业谷歌三星TPU2nm 工艺AI 芯片推荐理由:谷歌 TPU 成本优势已让英伟达紧张,若三星 2nm 代工落地,AI 芯片供应链将更分散——做 AI 基础设施的团队值得关注这一变局。原文
11:15IT之家(博客/媒体)科技媒体 Wccftech 报道,Marvell(美满电子)近期获得谷歌 TPU 定制网络芯片设计订单,该芯片用于连接多个 ASIC 构建同步计算集群,协调数据流与处理拥塞。由于台积电先进节点产能紧张,该芯片可能采用英特尔 18A 或 18AP 制程,预计 2027 年底量产。此前英伟达 CEO 黄仁勋曾预言 Marvell 将成为下一个万亿美元公司,消息后其股价大涨 25%。这一订单标志着 Marvell 在 AI 数据中心网络芯片领域的重要突破,也反映了谷歌对定制化 AI 基础设施的持续投入。行业Marvell谷歌TPU网络芯片AI 数据中心推荐理由:AI 数据中心网络芯片需求激增,做 AI 基础设施或芯片设计的团队值得关注 Marvell 的布局——黄仁勋的预言和谷歌的订单都是信号。原文
10:45IT之家(博客/媒体)精选72°谷歌与全球最大私募股权集团黑石合作,计划在美国成立一家新的AI云公司,初期黑石投入50亿美元股权资本,整体计算投资规模预计约250亿美元。新公司将依托谷歌自研TPU芯片和云能力,挑战CoreWeave等AI算力服务商,被视为谷歌最大规模的对外芯片商业化尝试。目标是在2027年上线500兆瓦容量,相当于一座中等城市的用电需求。此举将加剧谷歌与英伟达在AI算力市场的竞争,黑石作为AI基础设施领域最活跃的投资方之一,已拥有超过1500亿美元数据中心资产。行业谷歌黑石AI云TPU算力服务推荐理由:谷歌终于把TPU推向外部市场,做AI训练和推理的团队将多一个算力选择,值得关注这个250亿美元级别的云服务新玩家。原文
00:33Google Developers Blog(博客/媒体)TorchTPU是Google为TPU打造的原生PyTorch运行栈,旨在最小代码改动下实现高性能分布式训练。它采用“Eager First”模式,并利用XLA编译器优化集群训练。项目计划在2026年进一步降低编译开销,支持动态形状和自定义内核,以支持下一代AI模型的扩展。AI产品TPUPyTorchXLA编译器分布式训练Google推荐理由:TorchTPU让PyTorch用户能够更顺畅地迁移到TPU,同时保持Eager模式体验,这对需要TPU算力的大规模AI训练场景有直接价值。原文
00:33Google Developers Blog(博客/媒体)Google的MaxText框架现在支持在单主机TPU上进行监督微调(SFT)和强化学习(RL),利用JAX和Tunix库实现高效模型优化。开发者可通过GRPO和GSPO等算法轻松调整预训练模型以适应专业任务和复杂推理。该更新简化了从单主机到多主机配置的微调流程,为后训练工作流提供了可扩展路径。AI产品微调/RLTPUJAXMaxText推荐理由:这表明Google正在降低TPU上高级模型微调的门槛,让中小规模团队也能在单主机TPU上应用RL算法进行后训练,对AI开发实践有实用价值。原文
00:33Google Developers Blog(博客/媒体)加州大学圣地亚哥分校研究者将DFlash(一种块扩散推测解码方法)成功部署到Google TPU上,通过单次前向传播“绘制”整个候选词块,绕过传统自回归逐步预测的顺序瓶颈。该系统在TPU上实现了平均3.13倍的加速,峰值性能接近现有EAGLE-3方法的两倍。该开源方案已集成至vLLM生态,利用TPU的免费并行验证和高品质草稿预测,显著提升复杂推理任务的效率。AI模型推理加速推测解码TPU开源/仓库vLLM推荐理由:这一工作展示了扩散式推测解码在TPU上的实际落地价值,突破传统推测解码的顺序瓶颈,尤其利好大规模LLM推理场景。开源集成至vLLM有助于行业快速采用。原文