全部 AI 动态 · AI 热点

6月19日

03:46

03:46

Jeff Dean@JeffDean

73°

Jeff Dean宣布一篇将发表于IEEE Micro 2026年7/8月刊的论文，详细回顾Google从TPU v2到Ironwood共五代训练超算的架构演变。论文披露TPU每芯片每瓦TFLOPS提升了约30倍，每个pod的芯片数从TPU v2的256颗扩增至Ironwood的9216颗。冷却方式从风冷（TPU v2）转为水冷（TPU v3起），互连从2D torus升级为3D torus。论文还指出工作负载已大幅转向Transformer模型。

论文 TPU Google Ironwood AI芯片能效

推荐理由：想看TPU五代真实进化数据和能效提升细节？这篇论文从256芯片到9216芯片、从风冷到水冷、30倍每瓦算力提升，全是硬货。

6月18日

04:27

04:27

LMSYS Org (SGLang)@lmsysorg

精选73°

LMSYS 发表博客详解如何用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T（1T 参数混合 MoE 模型）。通过 Fused MoE V2 内核将令牌和累加器留在 VMEM 中并双缓冲专家权重，MoE 预填充延迟降低 53%。混合内存池为 10 个全注意力层分配逐令牌 MLA KV，为 70 个 GLA 层分配逐请求循环状态。GLA 线性注意力采用分块并行预填充，单控制器 DP 保持分组 RMS Norm 芯片本地化，无需逐层跨芯片规约。

AI模型 Ling-2.6-1T TPU SGLang-JAX MoE 推理优化

推荐理由：LMSYS 和 InclusionAI 联手，用 SGLang-JAX 让 1T 参数 MoE 在 TPU 上跑得快 53%，技术细节都在博客里。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月8日

22:50

22:50

rohanpaul_ai@rohanpaul_ai

据 The Information 报道，Google 已选择 Intel 为其制造超过 300 万颗 TPU 芯片，计划于 2028 年交付。这对 Intel 的晶圆代工业务是一次重大胜利，使其成为 NVIDIA 主要 AI 竞争对手的工厂。由于 AI 热潮导致芯片需求激增，台积电产能紧张，多家 AI 芯片设计公司转向 Intel 作为第二供应商，以降低供应链风险。此举对 Google、NVIDIA、Apple、Tesla 等公司而言，意味着供应链多元化的重要进展。

行业 Google Intel TPU 芯片制造供应链

推荐理由：AI 芯片供应链正在重构，做 AI 基础设施或依赖 GPU/TPU 的团队值得关注——Intel 代工崛起可能改变未来芯片成本和供应格局。

5月21日

00:10

00:10

小互@imxiaohu

精选

Midjourney创始人公开表示，团队因采用Google TPU进行训练，研究进度相比使用Nvidia GPU技术栈落后约一年。他称如果回到过去，会从一开始就全部使用Nvidia的方案。这一言论反映了大模型训练中硬件生态适配的隐蔽成本。

行业 Midjourney Google TPU Nvidia GPU AI训练

推荐理由：创始人亲述选错硬件的代价

5月14日

13:37

13:37

Jeff Dean@JeffDean

Google 首席科学家 Jeff Dean 在 Cloud Next 上与 Amin Vahdat 及 AcquiredFM 主持人讨论了新发布的 TPU v8t 和 v8i 芯片。这些芯片专为 AI 训练和推理优化，性能大幅提升。Jeff Dean 在推文中分享了个人兴奋点，并附上博客文章链接。该发布标志着 Google 在 AI 硬件领域的持续投入，对云服务和 AI 开发者意义重大。

AI产品 TPU Google AI 硬件 Cloud Next 芯片

推荐理由：Google 新一代 TPU 发布，AI 训练和推理性能再升级，做大规模模型训练或云服务的团队值得关注，看看 Jeff Dean 最兴奋的点是什么。

13:37

13:37

Jeff Dean@JeffDean

精选

Google Translate 迎来20周年，Jeff Dean 回顾了其关键里程碑：2006年首次部署基于5-gram语言模型的系统，使用了万亿词级训练数据，是早期大语言模型实践；2016年转向深度神经网络，结合序列到序列模型和自研TPU，推理性能提升30-80倍，延迟降低15-30倍，使服务可覆盖数亿用户；近期又借助Gemini模型进一步优化。这些技术迭代持续提升了翻译质量和全球连接性。

AI产品 Google Translate 机器翻译大语言模型 TPU 序列到序列

推荐理由：Jeff Dean 亲自梳理了 Google Translate 从统计方法到神经网络的两次关键跃迁，做 NLP/翻译系统的开发者能从中看到技术选型的真实演进逻辑，值得一读。