18gb·general

18gb

别名
首次出现
2026-06-05
最近出现
2026-06-11
累计提及
9
§ 01综述

近日,Google 开源了 DiffusionGemma 系列模型,这是一种基于扩散架构的语言模型,与传统自回归模型不同,它通过迭代去噪生成文本,在推理速度和效率上实现了显著突破。该模型采用混合专家(MoE)架构,总参数量达 26B,但每次推理仅激活 3.8B 参数,大幅降低了计算开销。

  • 据小互报道,DiffusionGemma 在生成速度上达到每秒 1000+ tokens,远超传统模型。(原文链接
  • berryxia 指出,该模型仅需 18GB 显存即可运行,普通消费级显卡如 RTX 4090 也能轻松部署。(原文链接
  • 此外,开发者 Prince Canuma 已成功将 DiffusionGemma 与 Cohere North Mini Code 模型集成到 Mac MLX 框架中,进一步扩展了其应用场景。(原文链接
  • 当前焦点在于扩散语言模型能否在保持速度优势的同时,达到与自回归模型相当或更优的文本质量。未来值得观察其在实际应用中的表现,以及社区能否借此推动高效本地部署的浪潮。

    § 02相关报道04 条在档
    1. 01
      Google 开源 DiffusionGemma:扩散架构模型,1000+ tokens/s
      小互
    2. 02
      Prince Canuma 将 DiffusionGemma 和 Cohere North Mini Code 塞进 Mac MLX
      berryxia
    3. 03
      Google DiffusionGemma 开源:4倍速文本生成,18GB显卡可跑
      berryxia
    4. 04
      Google 发布 DiffusionGemma:26B MoE 开源模型,激活仅 3.8B,推理速度超快
      rohanpaul_ai
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/18gb