精选理由
不用额外训练,给离散扩散模型装上智能调度,并行生成质量更好、延迟更低。推理和代码生成都有效。
离散扩散语言模型通过并行生成令牌降低延迟,但独立选择易产生不兼容配置。本文提出训练免费解码框架,利用成对交互调整commit scores,通过变分松弛实现不动点更新。该方法无需辅助模型或重训练,可嵌入现有扩散解码流程。在推理和代码生成基准上,该方法在质量-延迟权衡方面取得一致改进。
AI 翻译 · 中文
离散扩散语言模型通过并行生成令牌降低延迟,但独立选择易产生不兼容配置。本文提出训练免费解码框架,利用成对交互调整commit scores,通过变分松弛实现不动点更新。该方法无需辅助模型或重训练,可嵌入现有扩散解码流程。在推理和代码生成基准上,该方法在质量-延迟权衡方面取得一致改进。
Discrete diffusion language models enable parallel token generation, offering a pathway to low-latency decoding. However, selecting tokens independently by marginal confidence limits effective parallelism: tokens that ap…