groq·general

Groq

别名
首次出现
2026-05-22
最近出现
2026-06-10
累计提及
20
§ 01综述

近年来,AI 推理加速芯片厂商 Groq 凭借其 LPU(Language Processing Unit)架构在极速推理领域占据一席之地。近期,Groq 一方面与三星商讨下一代 LPU 合作,旨在进一步提升算力密度与能效;另一方面,竞品与云服务商纷纷推出同等量级的推理速度方案,使这一赛道竞争白热化。

  • 三星与英伟达商讨下一代 Groq LPU 合作(IT之家)——三星正与英伟达共同讨论 Groq LPU 的下一代合作细节,计划将 LPU 引入更多数据中心场景,以提供更高效的推理服务。
  • 小米 MiMo-V2.5-Pro-UltraSpeed 实现单节点 8 卡 1T 模型 1000+ tokens/s(xiaomimimo)——小米发布的 MiMo-V2.5-Pro-UltraSpeed 在单节点 8 卡配置下,实现了千亿参数模型每秒超 1000 Token 的推理速度,直接对标 Groq 的极速能力。
  • Cerebras 为 Kimi K2.6 提供 ~1000 tokens/s 高速推理(shao__meng)——另一家 AI 芯片公司 Cerebras 同样宣称其硬件为 Kimi 模型提供了约 1000 tokens/s 的推理速度,进一步验证了极速推理的商业可行性。
  • 当前焦点:Groq 依然保持 LPU 架构在低延迟方面的独特优势,但竞争态势日益严峻。小米、Cerebras 等玩家以相似速度进入市场,而英伟达也在加速下一代超级芯片部署。未来观察点:Groq 与三星的合作能否带来架构突破,以及如何在众多“千 tok/s”方案中维持差异化。同时,企业级应用(如银行、医疗)对速度和信任的双重要求,将是 Groq 验证其落地能力的关键。

    § 02相关报道08 条在档
    1. 01
      MiMo V2.5 Pro UltraSpeed 实测:每秒超1000 Token
      歸藏(guizang.ai)
    2. 02
      小米MiMo-V2.5-Pro-UltraSpeed:单节点8卡实现1T模型1000+ tokens/s
      xiaomimimo
    3. 03
      三星与英伟达商讨下一代 Groq LPU 合作
      IT之家
    4. 04
      黄仁勋宣布英伟达下一代AI超级芯片平台Vera Rubin全面投产
      IT之家
    5. 05
      字节跳动自研AI数据中心CPU,减少对英伟达依赖
      rohanpaul_ai
    6. 06
      Cerebras 为 Kimi K2.6 提供 ~1000 tokens/s 高速推理
      shao__meng
    7. 07
      企业AI智能体进入银行医院,Groq与StackAI合作强调信任与速度
      Groq
    8. 08
      Groq 助力 Solomei AI 打造实时个性化客服体验
      Groq
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/Groq