精选理由
DiffusionGemma 把文本生成速度拉到 4 倍,还彻底开源,做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。
Google 发布 DiffusionGemma,一种基于扩散模型的新型文本生成模型,速度可达 1000+ token/s,是传统自回归模型的 4 倍。它摒弃了逐词生成的方式,而是通过并行起草、纠错和精炼整段文本,实现高速生成。模型已以 Apache 2.0 协议开源,权重在 Hugging Face 上可获取,18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异,支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式,从串行生成转向并行炼句。
AI 翻译 · 中文
Google 发布 DiffusionGemma,一种基于扩散模型的新型文本生成模型,速度可达 1000+ token/s,是传统自回归模型的 4 倍。它摒弃了逐词生成的方式,而是通过并行起草、纠错和精炼整段文本,实现高速生成。模型已以 Apache 2.0 协议开源,权重在 Hugging Face 上可获取,18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异,支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式,从串行生成转向并行炼句。
兄弟们,Google 这个新“模型”有点意思! DiffusionGemma一口气把文本生成干到4倍速,还彻底开源Apache 2.0,谁都能本地玩。 它不用传统自回归那种“吐一个词想下一个”的老办法。 而是直接用diffusion先扔一堆噪声,然后整块整块地同时起草、同时纠错、同时精炼,1000+ token/s的速度直接起飞。 18GB消费级显卡就能顺滑跑,代码、数学、复杂编辑这些最烦人的活儿。 它现在能实时补空、格式化、自我修复,…