论文精选

GoR:用引文演化图监督 LLM 生成研究想法,达 SOTA

Graphs of Research: Citation Evolution Graphs as Supervision for Research Idea Generation

精选理由

做自动化科研或 AI 辅助创新的研究者,可以试试用引文关系图替代静态检索来激发 LLM 的创意,GoR 直接开源了数据和微调方法。

AI 摘要

现有 LLM 生成研究想法的方法多依赖静态文献检索或复杂提示工程,忽略了文献间的结构关系。研究者提出 Graphs of Research (GoR),通过提取每篇种子论文的 2 跳引用邻居,从引用位置、频率、前驱链接和发表时间推导关系,构建论文演化有向无环图 (DAG)。他们从五大 ML/NLP 会议收集数据,微调 Qwen2.5-7B-Instruct-1M 模型,在头对头 LLM 裁判锦标赛中击败 gpt-4o 基线,达到 SOTA。该方法证明了引文演化图作为监督信号的有效性,有望降低自动化科学创新的门槛。

AI 翻译 · 中文

现有 LLM 生成研究想法的方法多依赖静态文献检索或复杂提示工程,忽略了文献间的结构关系。研究者提出 Graphs of Research (GoR),通过提取每篇种子论文的 2 跳引用邻居,从引用位置、频率、前驱链接和发表时间推导关系,构建论文演化有向无环图 (DAG)。他们从五大 ML/NLP 会议收集数据,微调 Qwen2.5-7B-Instruct-1M 模型,在头对头 LLM 裁判锦标赛中击败 gpt-4o 基线,达到 SOTA。该方法证明了引文演化图作为监督信号的有效性,有望降低自动化科学创新的门槛。

arXiv cs.AIResearch idea generation is the innovation-driving step of automated scientific research. Recently, large language models (LLMs) have shown potential for automating idea generation at scale. However, existing methods mai