全部 AI 动态 · AI 热点

6月24日

22:14

22:14

Decoder@Maximilian Schreiner

86°

OpenAI与Broadcom联合推出了名为Jalapeño的定制芯片。该芯片专为大语言模型推理场景优化。计划于2026年底实现大规模部署。

AI产品 OpenAI Broadcom Jalapeño 推理芯片

推荐理由：OpenAI和Broadcom联手搞了一款叫Jalapeño的推理芯片，2026年底就能用上，跑大模型可能更快更省钱了。

21:21

21:21IT之家（博客/媒体）

83°

OpenAI与博通联合设计的定制AI推理芯片Jalapeño首次公开，性能声称可与英伟达Blackwell和谷歌TPU媲美。该芯片专为大语言模型优化，已完成与GPT-5.3-Codex-Spark模型的测试，功耗和性能达标。芯片由台积电制造，设计周期仅9个月，计划2024年底前内部部署，不对外销售。配套服务器由天弘科技生产，内存由SK海力士和三星供应。

AI产品 Jalapeño OpenAI 博通推理芯片定制芯片

推荐理由：OpenAI和博通搞定了自己的推理芯片Jalapeño，性能对标英伟达Blackwell，年底就用上，未来还有多代迭代。

21:15

21:15OpenAI Blog（博客/媒体）

76°

OpenAI和Broadcom联合推出Jalapeño芯片，这是一款专为LLM推理设计的定制AI芯片。该芯片旨在提升AI系统的性能、效率和可扩展性。它针对大规模AI部署进行了优化。

AI产品 OpenAI Broadcom Jalapeño 推理芯片 LLM推理

推荐理由：OpenAI和博通合作出了Jalapeño芯片，专为LLM推理优化，性能效率和扩展性都提升了，适合大规模AI系统。

6月22日

14:09

14:09IT之家（博客/媒体）

郭明錤透露，谷歌在 TPU v9（Humufish）基础上推出升级改款 Triggerfish，针对 AI 推理优化，由联发科独家代工。Triggerfish 片内 SRAM 缓存规模为 Humufish 的 2~3 倍，可降低数据传输开销；片外 DRAM 从 HBM4 升级至 HBM4E。该芯片旨在缓解“CPU 墙”与“内存墙”问题，预计2027年底投产，2028年底放量，生命周期出货 100~200 万颗，单价较 Humufish 高出约三成。还引入“simulation die”，可能用于本地 TPU 管理、训推切换等功能。

AI模型谷歌 TPU v9 联发科推理芯片 AI芯片

推荐理由：谷歌和联发科联手要做 TPU v9 推理升级版 Triggerfish，缓存翻倍、内存升级，2027 年就能看到成品了。

6月17日

23:12

23:12IT之家（博客/媒体）

字节跳动正与天数智芯洽谈采购至少5万颗智铠系列云端推理GPU，用于旗下AI聊天机器人“豆包”等产品的推理运算。若交易达成，天数智芯将成为字节跳动继华为和寒武纪之后的第三家国内GPU供应商。行业预测2026年字节预计投入1500亿元用于全球算力采购，其中国产算力约400亿元以上。据研究，推理能耗已占AI总能耗约60%至90%，中国推理需求达到训练需求的8倍。

行业天数智芯字节跳动豆包推理芯片国产算力

推荐理由：字节正在买天数智芯的推理芯片给豆包用，国产算力玩家越来越热闹，建议关注。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

10:37

10:37IT之家（博客/媒体）

71°

Tensordyne 发布 Napier 推理系统，宣称能效是 NVIDIA Blackwell 系统的 17 倍，吞吐量达 13 倍。Napier 采用对数数学设计简化乘法运算，由台积电 3nm 制程生产。TDN72 集成 72 颗芯片，机柜级系统可支持 1000 Token/s/user 的 LLM 推理。

AI产品 Tensordyne Napier Blackwell 推理芯片 AI芯片

推荐理由：Tensordyne 搞了个叫 Napier 的推理芯片，用对数数学省掉了乘法，据说比 NVIDIA Blackwell 快 13 倍，能耗还低 17 倍。初创敢叫板老黄，看看值不值。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？