全部 AI 动态 · AI 热点

6月25日

00:50

00:50

berryxia@berryxia

83°

OpenAI推出自研AI芯片Jalapeño，专用于推理（Inference）场景，设计制造仅用9个月，并由AI辅助完成。该芯片由Broadcom负责生产，目标是将推理成本降低约50%（Broadcom CEO原话）。早期性能数据显示，其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。

AI产品 OpenAI Jalapeño Broadcom 推理芯片芯片设计

推荐理由：OpenAI被推理成本逼急了，自研芯片Jalapeño，9个月流片，性能超Blackwell和TPU还省一半钱，值得看看细节。

6月24日

22:18

22:18

shao__meng@shao__meng

89°

OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño，耗时 9 个月，宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化，计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分，与 Google TPU、Amazon Trainium 等路径一致，旨在通过自研芯片提升推理效率、降低成本和改善用户体验。

AI模型 Jalapeño OpenAI Broadcom 推理芯片自研硬件

推荐理由：OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño，9 个月就流片了，能效比现在最好的还强，计划 2026 年底大规模部署，想自己掌控底层硬件。

22:14

22:14

Decoder@Maximilian Schreiner

86°

OpenAI与Broadcom联合推出了名为Jalapeño的定制芯片。该芯片专为大语言模型推理场景优化。计划于2026年底实现大规模部署。

AI产品 OpenAI Broadcom Jalapeño 推理芯片

推荐理由：OpenAI和Broadcom联手搞了一款叫Jalapeño的推理芯片，2026年底就能用上，跑大模型可能更快更省钱了。

21:21

21:21IT之家（博客/媒体）

83°

OpenAI与博通联合设计的定制AI推理芯片Jalapeño首次公开，性能声称可与英伟达Blackwell和谷歌TPU媲美。该芯片专为大语言模型优化，已完成与GPT-5.3-Codex-Spark模型的测试，功耗和性能达标。芯片由台积电制造，设计周期仅9个月，计划2024年底前内部部署，不对外销售。配套服务器由天弘科技生产，内存由SK海力士和三星供应。

AI产品 Jalapeño OpenAI 博通推理芯片定制芯片

推荐理由：OpenAI和博通搞定了自己的推理芯片Jalapeño，性能对标英伟达Blackwell，年底就用上，未来还有多代迭代。

21:15

21:15OpenAI Blog（博客/媒体）

76°

OpenAI和Broadcom联合推出Jalapeño芯片，这是一款专为LLM推理设计的定制AI芯片。该芯片旨在提升AI系统的性能、效率和可扩展性。它针对大规模AI部署进行了优化。

AI产品 OpenAI Broadcom Jalapeño 推理芯片 LLM推理

推荐理由：OpenAI和博通合作出了Jalapeño芯片，专为LLM推理优化，性能效率和扩展性都提升了，适合大规模AI系统。

6月22日

14:09

14:09IT之家（博客/媒体）

郭明錤透露，谷歌在 TPU v9（Humufish）基础上推出升级改款 Triggerfish，针对 AI 推理优化，由联发科独家代工。Triggerfish 片内 SRAM 缓存规模为 Humufish 的 2~3 倍，可降低数据传输开销；片外 DRAM 从 HBM4 升级至 HBM4E。该芯片旨在缓解“CPU 墙”与“内存墙”问题，预计2027年底投产，2028年底放量，生命周期出货 100~200 万颗，单价较 Humufish 高出约三成。还引入“simulation die”，可能用于本地 TPU 管理、训推切换等功能。

AI模型谷歌 TPU v9 联发科推理芯片 AI芯片

推荐理由：谷歌和联发科联手要做 TPU v9 推理升级版 Triggerfish，缓存翻倍、内存升级，2027 年就能看到成品了。

6月17日

23:12

23:12IT之家（博客/媒体）

字节跳动正与天数智芯洽谈采购至少5万颗智铠系列云端推理GPU，用于旗下AI聊天机器人“豆包”等产品的推理运算。若交易达成，天数智芯将成为字节跳动继华为和寒武纪之后的第三家国内GPU供应商。行业预测2026年字节预计投入1500亿元用于全球算力采购，其中国产算力约400亿元以上。据研究，推理能耗已占AI总能耗约60%至90%，中国推理需求达到训练需求的8倍。

行业天数智芯字节跳动豆包推理芯片国产算力

推荐理由：字节正在买天数智芯的推理芯片给豆包用，国产算力玩家越来越热闹，建议关注。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

10:37

10:37IT之家（博客/媒体）

71°

Tensordyne 发布 Napier 推理系统，宣称能效是 NVIDIA Blackwell 系统的 17 倍，吞吐量达 13 倍。Napier 采用对数数学设计简化乘法运算，由台积电 3nm 制程生产。TDN72 集成 72 颗芯片，机柜级系统可支持 1000 Token/s/user 的 LLM 推理。

AI产品 Tensordyne Napier Blackwell 推理芯片 AI芯片

推荐理由：Tensordyne 搞了个叫 Napier 的推理芯片，用对数数学省掉了乘法，据说比 NVIDIA Blackwell 快 13 倍，能耗还低 17 倍。初创敢叫板老黄，看看值不值。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月22日

03:05

03:05

rohanpaul_ai@rohanpaul_ai

76°

据 The Information 报道，Anthropic 正在与微软进行早期谈判，计划租赁并使用微软自研的 Maia 200 AI 芯片用于推理任务。微软宣称 Maia 200 在某些推理场景下比英伟达芯片更具成本效益。该芯片是微软第二代 AI 加速器，采用台积电 3nm 工艺，配备 216GB HBM3e 显存和 7TB/s 带宽，专为快速处理大模型推理而设计。Anthropic 已承诺向 Azure 投入 300 亿美元，微软可能向 Anthropic 投资 50 亿美元，且 Claude 已深度集成到微软 Copilot 中，因此芯片合作是双方客户-供应商反馈循环的一部分。分析认为，Maia 无需在所有领域击败英伟达，只要在特定高容量推理任务中更便宜，就能将数十亿 token 从 GPU 转移过来。

AI产品 Anthropic 微软 Maia 200 推理芯片成本优化

推荐理由：微软 Maia 芯片若在推理成本上优于英伟达，做大规模 AI 推理的团队将多一个省钱选择，Anthropic 的动向值得关注。