AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:推理芯片×
6月25日
00:50
00:50berryxia@berryxia
83°
OpenAI推出自研AI芯片Jalapeño,专用于推理(Inference)场景,设计制造仅用9个月,并由AI辅助完成。该芯片由Broadcom负责生产,目标是将推理成本降低约50%(Broadcom CEO原话)。早期性能数据显示,其性能功耗比显著优于NVIDIA Blackwell和Google TPU。首批样片已到手并开始测试。
AI产品OpenAIJalapeñoBroadcom推理芯片芯片设计

推荐理由:OpenAI被推理成本逼急了,自研芯片Jalapeño,9个月流片,性能超Blackwell和TPU还省一半钱,值得看看细节。
原文
6月24日
22:18
22:18shao__meng@shao__meng
89°
OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño,耗时 9 个月,宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化,计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分,与 Google TPU、Amazon Trainium 等路径一致,旨在通过自研芯片提升推理效率、降低成本和改善用户体验。
AI模型JalapeñoOpenAIBroadcom推理芯片自研硬件

推荐理由:OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño,9 个月就流片了,能效比现在最好的还强,计划 2026 年底大规模部署,想自己掌控底层硬件。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月22日
03:05
03:05rohanpaul_ai@rohanpaul_ai
76°
据 The Information 报道,Anthropic 正在与微软进行早期谈判,计划租赁并使用微软自研的 Maia 200 AI 芯片用于推理任务。微软宣称 Maia 200 在某些推理场景下比英伟达芯片更具成本效益。该芯片是微软第二代 AI 加速器,采用台积电 3nm 工艺,配备 216GB HBM3e 显存和 7TB/s 带宽,专为快速处理大模型推理而设计。Anthropic 已承诺向 Azure 投入 300 亿美元,微软可能向 Anthropic 投资 50 亿美元,且 Claude 已深度集成到微软 Copilot 中,因此芯片合作是双方客户-供应商反馈循环的一部分。分析认为,Maia 无需在所有领域击败英伟达,只要在特定高容量推理任务中更便宜,就能将数十亿 token 从 GPU 转移过来。
AI产品Anthropic微软Maia 200推理芯片成本优化

推荐理由:微软 Maia 芯片若在推理成本上优于英伟达,做大规模 AI 推理的团队将多一个省钱选择,Anthropic 的动向值得关注。
原文
精选全部日报登录