00:50berryxia@berryxia83°OpenAI推出自研AI芯片Jalapeño,专用于推理(Inference)场景,设计制造仅用9个月,并由AI辅助完成。该芯片由Broadcom负责生产,目标是将推理成本降低约50%(Broadcom CEO原话)。早期性能数据显示,其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。AI产品OpenAIJalapeñoBroadcom推理芯片芯片设计10 个信源在谈推荐理由:OpenAI被推理成本逼急了,自研芯片Jalapeño,9个月流片,性能超Blackwell和TPU还省一半钱,值得看看细节。原文
22:18shao__meng@shao__meng89°OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño,耗时 9 个月,宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化,计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分,与 Google TPU、Amazon Trainium 等路径一致,旨在通过自研芯片提升推理效率、降低成本和改善用户体验。AI模型JalapeñoOpenAIBroadcom推理芯片自研硬件10 个信源在谈推荐理由:OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño,9 个月就流片了,能效比现在最好的还强,计划 2026 年底大规模部署,想自己掌控底层硬件。原文
03:05rohanpaul_ai@rohanpaul_ai76°据 The Information 报道,Anthropic 正在与微软进行早期谈判,计划租赁并使用微软自研的 Maia 200 AI 芯片用于推理任务。微软宣称 Maia 200 在某些推理场景下比英伟达芯片更具成本效益。该芯片是微软第二代 AI 加速器,采用台积电 3nm 工艺,配备 216GB HBM3e 显存和 7TB/s 带宽,专为快速处理大模型推理而设计。Anthropic 已承诺向 Azure 投入 300 亿美元,微软可能向 Anthropic 投资 50 亿美元,且 Claude 已深度集成到微软 Copilot 中,因此芯片合作是双方客户-供应商反馈循环的一部分。分析认为,Maia 无需在所有领域击败英伟达,只要在特定高容量推理任务中更便宜,就能将数十亿 token 从 GPU 转移过来。AI产品Anthropic微软Maia 200推理芯片成本优化10 个信源在谈推荐理由:微软 Maia 芯片若在推理成本上优于英伟达,做大规模 AI 推理的团队将多一个省钱选择,Anthropic 的动向值得关注。原文