ASRD: 锚点监督可撤销解码提升扩散LLM性能

精选理由

这篇论文帮你用更少计算让扩散LLM更准更快，数学编程题准确率升6.4%，速度翻7倍，值得看一下。

AI 摘要

扩散大语言模型(dLLMs)在并行生成中面临解码速度与质量权衡。现有可撤销解码策略存在错误传播和局部错误强化问题。研究提出ASRD框架，通过时间一致性识别锚点令牌并动态缓存，引入锚点引导生成和锚点扰动验证两种机制。在数学和编码基准上，ASRD相比最新基线实现准确率提升最高6.4%，推理吞吐量提升最高7.2倍。

AI 翻译 · 中文

arXiv cs.AIDiffusion Large Language Models (dLLMs) offer a promising avenue for parallel generation but face a trade-off between decoding speed and quality. While revocable decoding strategies attempt to mitigate errors by verifyin…

阅读原文