DiffusionGemma 是 Google DeepMind 于 2025 年 2 月推出的一款基于扩散模型的文本生成开源模型。它采用 26B 参数的 MoE(混合专家)架构,但每次推理仅激活 3.8B 参数,从而在保持高性能的同时大幅提升计算效率。
- 近期主要进展包括:
- Google DeepMind 正式发布 DiffusionGemma,声称其文本生成速度达到每秒 1000 个 tokens,是传统自回归模型的 4 倍 (Google DeepMind 发布 DiffusionGemma:块级文本生成,速度提升 4 倍)。
- 该模型基于 Gemma 4 构建,采用了块级并行扩散过程,能够一次性生成多个 token,而非逐字生成,从而显著加速推理 (DiffusionGemma:4倍速文本生成,Apache 2.0开源)。
- 模型采用 Apache 2.0 许可完全开源,允许商业使用和修改,为研究者和开发者提供了重要资源 (DiffusionGemma:26B MoE 开源模型,激活仅 3.8B,推理速度超快)。
当前焦点在于 DiffusionGemma 将扩散模型从图像生成成功迁移到文本生成领域,挑战了自回归模型在 NLP 中的主导地位。尽管效果尚未完全对标顶级自回归模型,但其推理速度优势和多 token 并行生成能力为高效实时文本生成开辟了新路径。未来值得关注该模型在长文本、复杂推理任务上的实际表现,以及其对生成质量和可控性的影响。