离散扩散语言模型的平均场并行解码

精选理由

不用额外训练，给离散扩散模型装上智能调度，并行生成质量更好、延迟更低。推理和代码生成都有效。

AI 摘要

离散扩散语言模型通过并行生成令牌降低延迟，但独立选择易产生不兼容配置。本文提出训练免费解码框架，利用成对交互调整commit scores，通过变分松弛实现不动点更新。该方法无需辅助模型或重训练，可嵌入现有扩散解码流程。在推理和代码生成基准上，该方法在质量-延迟权衡方面取得一致改进。

AI 翻译 · 中文

arXiv cs.LGDiscrete diffusion language models enable parallel token generation, offering a pathway to low-latency decoding. However, selecting tokens independently by marginal confidence limits effective parallelism: tokens that ap…

阅读原文