代码代理需要多少静态结构?确定性锚点研究

How Much Static Structure Do Code Agents Need? A Study of Deterministic Anchoring

精选理由

这篇论文用实验告诉你:给代码代理加一点调用图注释,定位准了2.2%,交互少了1.6轮,运行还更稳定。比堆更多上下文管用。

AI 摘要

本研究系统性地向Codex代码代理注入不同粒度的静态结构注释(如调用图、继承拓扑),发现轻量级拓扑可将函数级定位准确率(Func@5)提升2.2个百分点,并减少1.6轮交互。静态锚点使代理的链接跟随率从0.15-0.18提升至0.21-0.24,单次运行通过率(Pass@1)增加3.4个百分点,同时运行方差减半。但代价是增加约10%的输入token,且稠密语义存在边际效益递减。研究建议中等规模项目默认使用轻量级拓扑,大型仓库裁剪前向边,隐式依赖场景才采用密集标签。

AI 翻译 · 中文

本研究系统性地向Codex代码代理注入不同粒度的静态结构注释(如调用图、继承拓扑),发现轻量级拓扑可将函数级定位准确率(Func@5)提升2.2个百分点,并减少1.6轮交互。静态锚点使代理的链接跟随率从0.15-0.18提升至0.21-0.24,单次运行通过率(Pass@1)增加3.4个百分点,同时运行方差减半。但代价是增加约10%的输入token,且稠密语义存在边际效益递减。研究建议中等规模项目默认使用轻量级拓扑,大型仓库裁剪前向边,隐式依赖场景才采用密集标签。

arXiv: OpenAILLM-based code agents navigate repositories through keyword search but miss the structural relationships, such as call graphs, inheritance hierarchies, and configuration dependencies, that define how software actually wo