Diffusion-Proof:超越自回归生成的形式定理证明新框架

Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation

精选理由

扩散模型也能做定理证明了,比自回归强,MiniF2F上高出6个百分点,还解了一道DeepSeek没解出的IMO题。

AI 摘要

研究团队提出Diffusion-Proof,这是首个将扩散LLM(dLLM)应用于形式定理证明的框架。该框架包含两个7B模型:dLLM-Prover-7B负责整段证明生成,dLLM-Corrector-7B利用双向信息进行局部校正。相比同等数据集训练的自回归基线,Diffusion-Proof在ProofNet-Test上提升1.61%,在MiniF2F-Test上提升6.14%。此外,该框架成功解决了一个更先进的DeepSeek-Prover-V2-7B未能解答的IMO问题,展示了扩散模型在长程连贯性任务上的优势。

AI 翻译 · 中文

研究团队提出Diffusion-Proof,这是首个将扩散LLM(dLLM)应用于形式定理证明的框架。该框架包含两个7B模型:dLLM-Prover-7B负责整段证明生成,dLLM-Corrector-7B利用双向信息进行局部校正。相比同等数据集训练的自回归基线,Diffusion-Proof在ProofNet-Test上提升1.61%,在MiniF2F-Test上提升6.14%。此外,该框架成功解决了一个更先进的DeepSeek-Prover-V2-7B未能解答的IMO问题,展示了扩散模型在长程连贯性任务上的优势。

arXiv: DeepSeekEnhancing the formal math reasoning capabilities of Large Language Models (LLMs) has become a key focus in both mathematical and computer science communities in recent years. While significant progress has been made in u