全部 AI 动态 · AI 热点

6月25日

00:50

00:50

berryxia@berryxia

83°

OpenAI推出自研AI芯片Jalapeño，专用于推理（Inference）场景，设计制造仅用9个月，并由AI辅助完成。该芯片由Broadcom负责生产，目标是将推理成本降低约50%（Broadcom CEO原话）。早期性能数据显示，其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。

AI产品 OpenAI Jalapeño Broadcom 推理芯片芯片设计

推荐理由：OpenAI被推理成本逼急了，自研芯片Jalapeño，9个月流片，性能超Blackwell和TPU还省一半钱，值得看看细节。

6月24日

22:18

22:18

shao__meng@shao__meng

89°

OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño，耗时 9 个月，宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化，计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分，与 Google TPU、Amazon Trainium 等路径一致，旨在通过自研芯片提升推理效率、降低成本和改善用户体验。

AI模型 Jalapeño OpenAI Broadcom 推理芯片自研硬件

推荐理由：OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño，9 个月就流片了，能效比现在最好的还强，计划 2026 年底大规模部署，想自己掌控底层硬件。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月22日

03:05

03:05

rohanpaul_ai@rohanpaul_ai

76°

据 The Information 报道，Anthropic 正在与微软进行早期谈判，计划租赁并使用微软自研的 Maia 200 AI 芯片用于推理任务。微软宣称 Maia 200 在某些推理场景下比英伟达芯片更具成本效益。该芯片是微软第二代 AI 加速器，采用台积电 3nm 工艺，配备 216GB HBM3e 显存和 7TB/s 带宽，专为快速处理大模型推理而设计。Anthropic 已承诺向 Azure 投入 300 亿美元，微软可能向 Anthropic 投资 50 亿美元，且 Claude 已深度集成到微软 Copilot 中，因此芯片合作是双方客户-供应商反馈循环的一部分。分析认为，Maia 无需在所有领域击败英伟达，只要在特定高容量推理任务中更便宜，就能将数十亿 token 从 GPU 转移过来。

AI产品 Anthropic 微软 Maia 200 推理芯片成本优化

推荐理由：微软 Maia 芯片若在推理成本上优于英伟达，做大规模 AI 推理的团队将多一个省钱选择，Anthropic 的动向值得关注。