№groq·general
Groq
别名
- 首次出现
- 2026-05-22
- 最近出现
- 2026-06-10
- 累计提及
- 20
§ 01综述
近年来,AI 推理加速芯片厂商 Groq 凭借其 LPU(Language Processing Unit)架构在极速推理领域占据一席之地。近期,Groq 一方面与三星商讨下一代 LPU 合作,旨在进一步提升算力密度与能效;另一方面,竞品与云服务商纷纷推出同等量级的推理速度方案,使这一赛道竞争白热化。
三星与英伟达商讨下一代 Groq LPU 合作(IT之家)——三星正与英伟达共同讨论 Groq LPU 的下一代合作细节,计划将 LPU 引入更多数据中心场景,以提供更高效的推理服务。
小米 MiMo-V2.5-Pro-UltraSpeed 实现单节点 8 卡 1T 模型 1000+ tokens/s(xiaomimimo)——小米发布的 MiMo-V2.5-Pro-UltraSpeed 在单节点 8 卡配置下,实现了千亿参数模型每秒超 1000 Token 的推理速度,直接对标 Groq 的极速能力。
Cerebras 为 Kimi K2.6 提供 ~1000 tokens/s 高速推理(shao__meng)——另一家 AI 芯片公司 Cerebras 同样宣称其硬件为 Kimi 模型提供了约 1000 tokens/s 的推理速度,进一步验证了极速推理的商业可行性。
当前焦点:Groq 依然保持 LPU 架构在低延迟方面的独特优势,但竞争态势日益严峻。小米、Cerebras 等玩家以相似速度进入市场,而英伟达也在加速下一代超级芯片部署。未来观察点:Groq 与三星的合作能否带来架构突破,以及如何在众多“千 tok/s”方案中维持差异化。同时,企业级应用(如银行、医疗)对速度和信任的双重要求,将是 Groq 验证其落地能力的关键。