AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:形式定理证明×
6月18日
10:22
10:22arXiv: DeepSeek@Ruida Wang, Rui Pan, Pengcheng Wang, Shizhe Diao, Tong Zhang
研究团队提出Diffusion-Proof,这是首个将扩散LLM(dLLM)应用于形式定理证明的框架。该框架包含两个7B模型:dLLM-Prover-7B负责整段证明生成,dLLM-Corrector-7B利用双向信息进行局部校正。相比同等数据集训练的自回归基线,Diffusion-Proof在ProofNet-Test上提升1.61%,在MiniF2F-Test上提升6.14%。此外,该框架成功解决了一个更先进的DeepSeek-Prover-V2-7B未能解答的IMO问题,展示了扩散模型在长程连贯性任务上的优势。
AI模型Diffusion-ProofdLLM推理模型形式定理证明数学证明

推荐理由:扩散模型也能做定理证明了,比自回归强,MiniF2F上高出6个百分点,还解了一道DeepSeek没解出的IMO题。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月6日
15:43
15:43Pandaily@contact@pandaily.com (Pandaily)
精选83°
普林斯顿大学语言与智能实验室(PLI)发布了一篇关于 Goedel-Architect 的突破性论文,这是一个用于形式定理证明的智能体框架。该框架基于 DeepSeek V4 模型,在多个基准测试中取得了最先进的结果,同时成本仅为现有系统的 1/500。Goedel-Architect 通过将推理任务分解为可管理的子任务,并利用 DeepSeek V4 的高效推理能力,显著降低了形式验证的计算开销。这一成果有望推动数学证明和软件验证领域的自动化进程,使形式化方法更易于被学术界和工业界采用。
论文形式定理证明DeepSeek V4智能体框架成本优化普林斯顿大学

推荐理由:形式定理证明的成本一直是阻碍其大规模应用的瓶颈,Goedel-Architect 用 DeepSeek V4 把成本砍到原来的 1/500,做数学验证和软件安全的团队可以直接关注这个新范式。
原文
精选全部日报登录