论文精选72°

CoT推理的熵动力学:发现两阶段结构,实现高效早退

Unveiling the Entropy Dynamics of Chain-of-Thought Reasoning

精选理由

这篇论文揭示了CoT推理中隐藏的熵动力学规律,做推理加速和模型效率优化的研究者可以直接用CUSUM方法实现无训练早退,比现有方法更优。

AI 摘要

这篇论文研究了链式推理(CoT)过程中的熵变化,发现了一个一致的两阶段结构:先是不确定性探索阶段,然后突然过渡到置信收敛阶段。置信阶段具有高可靠性和高冗余性两个关键特性,模型在得出正确答案后仍会生成大量无用token。基于此,作者提出了两种更高效的推理策略:早退机制(Early Exit)和测试时缩放(Test-Time Scaling)。他们使用累积和(CUSUM)算法进行实时推理控制,无需额外训练。实验表明,CUSUM早退在准确率63.06%时实现了11.1%的token缩减,优于DEER和Dynasor。

AI 翻译 · 中文

这篇论文研究了链式推理(CoT)过程中的熵变化,发现了一个一致的两阶段结构:先是不确定性探索阶段,然后突然过渡到置信收敛阶段。置信阶段具有高可靠性和高冗余性两个关键特性,模型在得出正确答案后仍会生成大量无用token。基于此,作者提出了两种更高效的推理策略:早退机制(Early Exit)和测试时缩放(Test-Time Scaling)。他们使用累积和(CUSUM)算法进行实时推理控制,无需额外训练。实验表明,CUSUM早退在准确率63.06%时实现了11.1%的token缩减,优于DEER和Dynasor。

arXiv cs.LGThis paper investigates the entropy dynamics of Chain-of-Thought (CoT) and uncovers a consistent two-phase structure: an Uncertainty Region of exploration transitioning sharply to a Confidence Region of convergence. We d