DiffusionGemma

§ 01综述

DiffusionGemma 是 Google DeepMind 于 2025 年 2 月推出的一款基于扩散模型的文本生成开源模型。它采用 26B 参数的 MoE（混合专家）架构，但每次推理仅激活 3.8B 参数，从而在保持高性能的同时大幅提升计算效率。

Google DeepMind 正式发布 DiffusionGemma，声称其文本生成速度达到每秒 1000 个 tokens，是传统自回归模型的 4 倍 (Google DeepMind 发布 DiffusionGemma：块级文本生成，速度提升 4 倍)。
该模型基于 Gemma 4 构建，采用了块级并行扩散过程，能够一次性生成多个 token，而非逐字生成，从而显著加速推理 (DiffusionGemma：4倍速文本生成，Apache 2.0开源)。
模型采用 Apache 2.0 许可完全开源，允许商业使用和修改，为研究者和开发者提供了重要资源 (DiffusionGemma：26B MoE 开源模型，激活仅 3.8B，推理速度超快)。

当前焦点在于 DiffusionGemma 将扩散模型从图像生成成功迁移到文本生成领域，挑战了自回归模型在 NLP 中的主导地位。尽管效果尚未完全对标顶级自回归模型，但其推理速度优势和多 token 并行生成能力为高效实时文本生成开辟了新路径。未来值得关注该模型在长文本、复杂推理任务上的实际表现，以及其对生成质量和可控性的影响。

§ 02相关报道10 条在档

§ 03邻近话题