CoT推理的熵动力学：发现两阶段结构，实现高效早退

精选理由

这篇论文揭示了CoT推理中隐藏的熵动力学规律，做推理加速和模型效率优化的研究者可以直接用CUSUM方法实现无训练早退，比现有方法更优。

AI 摘要

这篇论文研究了链式推理（CoT）过程中的熵变化，发现了一个一致的两阶段结构：先是不确定性探索阶段，然后突然过渡到置信收敛阶段。置信阶段具有高可靠性和高冗余性两个关键特性，模型在得出正确答案后仍会生成大量无用token。基于此，作者提出了两种更高效的推理策略：早退机制（Early Exit）和测试时缩放（Test-Time Scaling）。他们使用累积和（CUSUM）算法进行实时推理控制，无需额外训练。实验表明，CUSUM早退在准确率63.06%时实现了11.1%的token缩减，优于DEER和Dynasor。

AI 翻译 · 中文

arXiv cs.LGThis paper investigates the entropy dynamics of Chain-of-Thought (CoT) and uncovers a consistent two-phase structure: an Uncertainty Region of exploration transitioning sharply to a Confidence Region of convergence. We d…

阅读原文