00:50berryxia@berryxia83°OpenAI推出自研AI芯片Jalapeño,专用于推理(Inference)场景,设计制造仅用9个月,并由AI辅助完成。该芯片由Broadcom负责生产,目标是将推理成本降低约50%(Broadcom CEO原话)。早期性能数据显示,其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。AI产品OpenAIJalapeñoBroadcom推理芯片芯片设计10 个信源在谈推荐理由:OpenAI被推理成本逼急了,自研芯片Jalapeño,9个月流片,性能超Blackwell和TPU还省一半钱,值得看看细节。原文
22:18shao__meng@shao__meng89°OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño,耗时 9 个月,宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化,计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分,与 Google TPU、Amazon Trainium 等路径一致,旨在通过自研芯片提升推理效率、降低成本和改善用户体验。AI模型JalapeñoOpenAIBroadcom推理芯片自研硬件10 个信源在谈推荐理由:OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño,9 个月就流片了,能效比现在最好的还强,计划 2026 年底大规模部署,想自己掌控底层硬件。原文
22:14Decoder@Maximilian Schreiner86°OpenAI与Broadcom联合推出了名为Jalapeño的定制芯片。该芯片专为大语言模型推理场景优化。计划于2026年底实现大规模部署。AI产品OpenAIBroadcomJalapeño推理芯片10 个信源在谈推荐理由:OpenAI和Broadcom联手搞了一款叫Jalapeño的推理芯片,2026年底就能用上,跑大模型可能更快更省钱了。原文
21:21IT之家(博客/媒体)83°OpenAI与博通联合设计的定制AI推理芯片Jalapeño首次公开,性能声称可与英伟达Blackwell和谷歌TPU媲美。该芯片专为大语言模型优化,已完成与GPT-5.3-Codex-Spark模型的测试,功耗和性能达标。芯片由台积电制造,设计周期仅9个月,计划2024年底前内部部署,不对外销售。配套服务器由天弘科技生产,内存由SK海力士和三星供应。AI产品JalapeñoOpenAI博通推理芯片定制芯片10 个信源在谈推荐理由:OpenAI和博通搞定了自己的推理芯片Jalapeño,性能对标英伟达Blackwell,年底就用上,未来还有多代迭代。原文
21:15OpenAI Blog(博客/媒体)76°OpenAI和Broadcom联合推出Jalapeño芯片,这是一款专为LLM推理设计的定制AI芯片。该芯片旨在提升AI系统的性能、效率和可扩展性。它针对大规模AI部署进行了优化。AI产品OpenAIBroadcomJalapeño推理芯片LLM推理10 个信源在谈推荐理由:OpenAI和博通合作出了Jalapeño芯片,专为LLM推理优化,性能效率和扩展性都提升了,适合大规模AI系统。原文
14:09IT之家(博客/媒体)郭明錤透露,谷歌在 TPU v9(Humufish)基础上推出升级改款 Triggerfish,针对 AI 推理优化,由联发科独家代工。Triggerfish 片内 SRAM 缓存规模为 Humufish 的 2~3 倍,可降低数据传输开销;片外 DRAM 从 HBM4 升级至 HBM4E。该芯片旨在缓解“CPU 墙”与“内存墙”问题,预计2027年底投产,2028年底放量,生命周期出货 100~200 万颗,单价较 Humufish 高出约三成。还引入“simulation die”,可能用于本地 TPU 管理、训推切换等功能。AI模型谷歌TPU v9联发科推理芯片AI芯片推荐理由:谷歌和联发科联手要做 TPU v9 推理升级版 Triggerfish,缓存翻倍、内存升级,2027 年就能看到成品了。原文
23:12IT之家(博客/媒体)字节跳动正与天数智芯洽谈采购至少5万颗智铠系列云端推理GPU,用于旗下AI聊天机器人“豆包”等产品的推理运算。若交易达成,天数智芯将成为字节跳动继华为和寒武纪之后的第三家国内GPU供应商。行业预测2026年字节预计投入1500亿元用于全球算力采购,其中国产算力约400亿元以上。据研究,推理能耗已占AI总能耗约60%至90%,中国推理需求达到训练需求的8倍。行业天数智芯字节跳动豆包推理芯片国产算力推荐理由:字节正在买天数智芯的推理芯片给豆包用,国产算力玩家越来越热闹,建议关注。原文
10:37IT之家(博客/媒体)71°Tensordyne 发布 Napier 推理系统,宣称能效是 NVIDIA Blackwell 系统的 17 倍,吞吐量达 13 倍。Napier 采用对数数学设计简化乘法运算,由台积电 3nm 制程生产。TDN72 集成 72 颗芯片,机柜级系统可支持 1000 Token/s/user 的 LLM 推理。AI产品TensordyneNapierBlackwell推理芯片AI芯片4 个信源在谈推荐理由:Tensordyne 搞了个叫 Napier 的推理芯片,用对数数学省掉了乘法,据说比 NVIDIA Blackwell 快 13 倍,能耗还低 17 倍。初创敢叫板老黄,看看值不值。原文
03:05rohanpaul_ai@rohanpaul_ai76°据 The Information 报道,Anthropic 正在与微软进行早期谈判,计划租赁并使用微软自研的 Maia 200 AI 芯片用于推理任务。微软宣称 Maia 200 在某些推理场景下比英伟达芯片更具成本效益。该芯片是微软第二代 AI 加速器,采用台积电 3nm 工艺,配备 216GB HBM3e 显存和 7TB/s 带宽,专为快速处理大模型推理而设计。Anthropic 已承诺向 Azure 投入 300 亿美元,微软可能向 Anthropic 投资 50 亿美元,且 Claude 已深度集成到微软 Copilot 中,因此芯片合作是双方客户-供应商反馈循环的一部分。分析认为,Maia 无需在所有领域击败英伟达,只要在特定高容量推理任务中更便宜,就能将数十亿 token 从 GPU 转移过来。AI产品Anthropic微软Maia 200推理芯片成本优化10 个信源在谈推荐理由:微软 Maia 芯片若在推理成本上优于英伟达,做大规模 AI 推理的团队将多一个省钱选择,Anthropic 的动向值得关注。原文