6月17日
6月10日
6月8日
6月2日
5月29日
5月28日
5月26日
5月22日
11:11
11:11arXiv cs.AI@George Tsoukalas, Anton Kovsharov, Sergey Shirobokov, Anja Surina, Moritz Firsching, Gergely Bérczi, Francisco J. R. Ruiz, Arun Suggala, Adam Zsolt Wagner, Eric Wieser, Lei Yu, Aja Huang, Miklós Z. Horváth, Andrew Ferrauiolo, Henryk Michalewski, Codrut Grosu, Thomas Hubert, Matej Balog, Pushmeet Kohli, Swarat Chaudhuri
精选72°
研究人员首次大规模评估了用大语言模型生成形式化证明(Lean 语言)解决开放数学问题的能力。其最强大的智能体以每个问题几百美元的成本,自主解决了 353 个开放 Erdős 问题中的 9 个,并证明了 492 个 OEIS 猜想中的 44 个。该智能体已被部署在组合数学、优化、图论、代数几何和量子光学研究中。一个更基础的智能体(交替 LLM 生成与 Lean 验证)也复现了 Erdős 问题的成功,但在最难问题上成本更高。这些结果展示了 AI 辅助形式化证明搜索的潜力,并揭示了实现这一能力的智能体设计。
推荐理由:数学研究者终于有了能真正解决开放问题的 AI 工具——成本可控且覆盖多个数学分支,做组合数学或图论的人可以直接用这个智能体尝试自己的猜想。
5月20日
10:31
10:31arXiv cs.AI@Wen Shi, Zhe Wang, Huafei Huang, Qing Qing, Ziqi Xu, Qixin Zhang, Xikun Zhang, Renqiang Luo, Feng Xia
精选
TERGAD 是一种新型图异常检测框架,通过大语言模型将节点拓扑属性转化为自然语言描述,生成高维语义嵌入,再与原始节点特征自适应融合。该方法解决了现有文本增强方法忽略节点结构上下文的问题,能检测由内容与拓扑不一致导致的复杂异常。在六个真实数据集上,TERGAD 持续优于现有基线,消融实验验证了结构语义引导和门控融合机制的有效性。代码已开源。
推荐理由:做图异常检测的研究者终于有了一个能同时利用结构语义和文本特征的框架——TERGAD 用 LLM 把拓扑信息翻译成自然语言,比纯数值特征更易捕捉异常模式,建议做 GAD 的团队直接跑一下开源代码。
5月19日
5月13日
5月12日