10:45arXiv cs.AI@Yizhen Yao, Qinglin Zhu, Runcong Zhao, Xiangxiang Dai, Yanzheng Xiang, Yulan He, Lin Gui扩散大语言模型(dLLMs)在并行生成中面临解码速度与质量权衡。现有可撤销解码策略存在错误传播和局部错误强化问题。研究提出ASRD框架,通过时间一致性识别锚点令牌并动态缓存,引入锚点引导生成和锚点扰动验证两种机制。在数学和编码基准上,ASRD相比最新基线实现准确率提升最高6.4%,推理吞吐量提升最高7.2倍。论文ASRD扩散LLMAnchor Tokens可撤销解码推理模型推荐理由:这篇论文帮你用更少计算让扩散LLM更准更快,数学编程题准确率升6.4%,速度翻7倍,值得看一下。原文