Groq · AI 话题观测

§ 01综述

近年来，AI 推理加速芯片厂商 Groq 凭借其 LPU（Language Processing Unit）架构在极速推理领域占据一席之地。近期，Groq 一方面与三星商讨下一代 LPU 合作，旨在进一步提升算力密度与能效；另一方面，竞品与云服务商纷纷推出同等量级的推理速度方案，使这一赛道竞争白热化。

三星与英伟达商讨下一代 Groq LPU 合作（IT之家）——三星正与英伟达共同讨论 Groq LPU 的下一代合作细节，计划将 LPU 引入更多数据中心场景，以提供更高效的推理服务。

小米 MiMo-V2.5-Pro-UltraSpeed 实现单节点 8 卡 1T 模型 1000+ tokens/s（xiaomimimo）——小米发布的 MiMo-V2.5-Pro-UltraSpeed 在单节点 8 卡配置下，实现了千亿参数模型每秒超 1000 Token 的推理速度，直接对标 Groq 的极速能力。

Cerebras 为 Kimi K2.6 提供 ~1000 tokens/s 高速推理（shao__meng）——另一家 AI 芯片公司 Cerebras 同样宣称其硬件为 Kimi 模型提供了约 1000 tokens/s 的推理速度，进一步验证了极速推理的商业可行性。

当前焦点：Groq 依然保持 LPU 架构在低延迟方面的独特优势，但竞争态势日益严峻。小米、Cerebras 等玩家以相似速度进入市场，而英伟达也在加速下一代超级芯片部署。未来观察点：Groq 与三星的合作能否带来架构突破，以及如何在众多“千 tok/s”方案中维持差异化。同时，企业级应用（如银行、医疗）对速度和信任的双重要求，将是 Groq 验证其落地能力的关键。

§ 02相关报道08 条在档

§ 03邻近话题