Google 发布 DiffusionGemma：实验性开放文本扩散模型，速度提升 4 倍

精选理由

DiffusionGemma 把文本生成速度推到了新高度，做代码补全、实时编辑的开发者可以直接在消费级 GPU 上体验 4 倍加速，值得一试。

AI 摘要

Google 发布了 DiffusionGemma，一款基于文本扩散技术的实验性开放模型，采用 Apache 2.0 许可证。该模型通过将瓶颈从内存带宽转移到原始计算，在专用 GPU 上实现高达 4 倍的 token 输出速度。推理时仅激活 3.8B 参数，量化后可在 24GB VRAM 的高端消费级 GPU 上运行。它支持并行 token 生成和自我纠正，特别适合代码填充、内联编辑和非线性结构任务。DiffusionGemma 优先考虑速度而非原始质量，在计算受限的硬件上加速效果最佳，而标准 Gemma 4 仍推荐用于生产环境和内存受限设备。

AI 翻译 · 中文

Google AI DevelopersDiffusionGemma, our experimental open model released under an Apache 2.0 license, explores text diffusion, an exceptionally fast approach to text generation. Here’s how DiffusionGemma accelerates development: + Faster to…

查看原推