Google DeepMind 发布 DiffusionGemma:文本扩散模型,4倍加速输出

This is awesome! I am spending a lot of time on diffusion LLMs these days, so this is perfect timin...

精选理由

文本扩散模型的研究者终于有了一个强大的开放基线——DiffusionGemma 同时生成整段文本并支持实时纠错,做生成式 AI 研究的团队值得下载权重试试。

AI 摘要

Google DeepMind 推出 DiffusionGemma,一种基于扩散的新型开放模型,可在专用 GPU 上实现最高 4 倍的输出加速。与传统逐词预测不同,它同时生成整段文本,并能在生成过程中自我纠错和实时格式化复杂 Markdown。该模型权重已在 Hugging Face 上开放。这对于文本扩散领域的研究者来说是一个重要进展,因为该方向目前仍有大量未探索的研究问题。

AI 翻译 · 中文

Google DeepMind 推出 DiffusionGemma,一种基于扩散的新型开放模型,可在专用 GPU 上实现最高 4 倍的输出加速。与传统逐词预测不同,它同时生成整段文本,并能在生成过程中自我纠错和实时格式化复杂 Markdown。该模型权重已在 Hugging Face 上开放。这对于文本扩散领域的研究者来说是一个重要进展,因为该方向目前仍有大量未探索的研究问题。

elvisThis is awesome! I am spending a lot of time on diffusion LLMs these days, so this is perfect timing. I feel like there are so many underexplored research questions around text diffusion. Weight available in HF. Google D