22:14Decoder@Maximilian Schreiner86°OpenAI与Broadcom联合推出了名为Jalapeño的定制芯片。该芯片专为大语言模型推理场景优化。计划于2026年底实现大规模部署。AI产品OpenAIBroadcomJalapeño推理芯片10 个信源在谈推荐理由:OpenAI和Broadcom联手搞了一款叫Jalapeño的推理芯片,2026年底就能用上,跑大模型可能更快更省钱了。原文
21:21IT之家(博客/媒体)83°OpenAI与博通联合设计的定制AI推理芯片Jalapeño首次公开,性能声称可与英伟达Blackwell和谷歌TPU媲美。该芯片专为大语言模型优化,已完成与GPT-5.3-Codex-Spark模型的测试,功耗和性能达标。芯片由台积电制造,设计周期仅9个月,计划2024年底前内部部署,不对外销售。配套服务器由天弘科技生产,内存由SK海力士和三星供应。AI产品JalapeñoOpenAI博通推理芯片定制芯片10 个信源在谈推荐理由:OpenAI和博通搞定了自己的推理芯片Jalapeño,性能对标英伟达Blackwell,年底就用上,未来还有多代迭代。原文
21:15OpenAI Blog(博客/媒体)76°OpenAI和Broadcom联合推出Jalapeño芯片,这是一款专为LLM推理设计的定制AI芯片。该芯片旨在提升AI系统的性能、效率和可扩展性。它针对大规模AI部署进行了优化。AI产品OpenAIBroadcomJalapeño推理芯片LLM推理10 个信源在谈推荐理由:OpenAI和博通合作出了Jalapeño芯片,专为LLM推理优化,性能效率和扩展性都提升了,适合大规模AI系统。原文
14:09IT之家(博客/媒体)郭明錤透露,谷歌在 TPU v9(Humufish)基础上推出升级改款 Triggerfish,针对 AI 推理优化,由联发科独家代工。Triggerfish 片内 SRAM 缓存规模为 Humufish 的 2~3 倍,可降低数据传输开销;片外 DRAM 从 HBM4 升级至 HBM4E。该芯片旨在缓解“CPU 墙”与“内存墙”问题,预计2027年底投产,2028年底放量,生命周期出货 100~200 万颗,单价较 Humufish 高出约三成。还引入“simulation die”,可能用于本地 TPU 管理、训推切换等功能。AI模型谷歌TPU v9联发科推理芯片AI芯片推荐理由:谷歌和联发科联手要做 TPU v9 推理升级版 Triggerfish,缓存翻倍、内存升级,2027 年就能看到成品了。原文
23:12IT之家(博客/媒体)字节跳动正与天数智芯洽谈采购至少5万颗智铠系列云端推理GPU,用于旗下AI聊天机器人“豆包”等产品的推理运算。若交易达成,天数智芯将成为字节跳动继华为和寒武纪之后的第三家国内GPU供应商。行业预测2026年字节预计投入1500亿元用于全球算力采购,其中国产算力约400亿元以上。据研究,推理能耗已占AI总能耗约60%至90%,中国推理需求达到训练需求的8倍。行业天数智芯字节跳动豆包推理芯片国产算力推荐理由:字节正在买天数智芯的推理芯片给豆包用,国产算力玩家越来越热闹,建议关注。原文
10:37IT之家(博客/媒体)71°Tensordyne 发布 Napier 推理系统,宣称能效是 NVIDIA Blackwell 系统的 17 倍,吞吐量达 13 倍。Napier 采用对数数学设计简化乘法运算,由台积电 3nm 制程生产。TDN72 集成 72 颗芯片,机柜级系统可支持 1000 Token/s/user 的 LLM 推理。AI产品TensordyneNapierBlackwell推理芯片AI芯片4 个信源在谈推荐理由:Tensordyne 搞了个叫 Napier 的推理芯片,用对数数学省掉了乘法,据说比 NVIDIA Blackwell 快 13 倍,能耗还低 17 倍。初创敢叫板老黄,看看值不值。原文