Google 发布 DiffusionGemma:实验性开放文本扩散模型,速度提升 4 倍

DiffusionGemma, our experimental open model released under an Apache 2.0 license, explores text diff...

精选理由

DiffusionGemma 把文本生成速度推到了新高度,做代码补全、实时编辑的开发者可以直接在消费级 GPU 上体验 4 倍加速,值得一试。

AI 摘要

Google 发布了 DiffusionGemma,一款基于文本扩散技术的实验性开放模型,采用 Apache 2.0 许可证。该模型通过将瓶颈从内存带宽转移到原始计算,在专用 GPU 上实现高达 4 倍的 token 输出速度。推理时仅激活 3.8B 参数,量化后可在 24GB VRAM 的高端消费级 GPU 上运行。它支持并行 token 生成和自我纠正,特别适合代码填充、内联编辑和非线性结构任务。DiffusionGemma 优先考虑速度而非原始质量,在计算受限的硬件上加速效果最佳,而标准 Gemma 4 仍推荐用于生产环境和内存受限设备。

AI 翻译 · 中文

Google 发布了 DiffusionGemma,一款基于文本扩散技术的实验性开放模型,采用 Apache 2.0 许可证。该模型通过将瓶颈从内存带宽转移到原始计算,在专用 GPU 上实现高达 4 倍的 token 输出速度。推理时仅激活 3.8B 参数,量化后可在 24GB VRAM 的高端消费级 GPU 上运行。它支持并行 token 生成和自我纠正,特别适合代码填充、内联编辑和非线性结构任务。DiffusionGemma 优先考虑速度而非原始质量,在计算受限的硬件上加速效果最佳,而标准 Gemma 4 仍推荐用于生产环境和内存受限设备。

Google AI DevelopersDiffusionGemma, our experimental open model released under an Apache 2.0 license, explores text diffusion, an exceptionally fast approach to text generation. Here’s how DiffusionGemma accelerates development: + Faster to