Google DiffusionGemma 开源：4倍速文本生成，18GB显卡可跑

精选理由

DiffusionGemma 把文本生成速度拉到 4 倍，还彻底开源，做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。

AI 摘要

Google 发布 DiffusionGemma，一种基于扩散模型的新型文本生成模型，速度可达 1000+ token/s，是传统自回归模型的 4 倍。它摒弃了逐词生成的方式，而是通过并行起草、纠错和精炼整段文本，实现高速生成。模型已以 Apache 2.0 协议开源，权重在 Hugging Face 上可获取，18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异，支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式，从串行生成转向并行炼句。

AI 翻译 · 中文

berryxia兄弟们，Google 这个新“模型”有点意思！ DiffusionGemma一口气把文本生成干到4倍速，还彻底开源Apache 2.0，谁都能本地玩。它不用传统自回归那种“吐一个词想下一个”的老办法。而是直接用diffusion先扔一堆噪声，然后整块整块地同时起草、同时纠错、同时精炼，1000+ token/s的速度直接起飞。 18GB消费级显卡就能顺滑跑，代码、数学、复杂编辑这些最烦人的活儿。它现在能实时补空、格式化、自我修复，…

查看原推