精选理由
这篇论文用实验告诉你:给代码代理加一点调用图注释,定位准了2.2%,交互少了1.6轮,运行还更稳定。比堆更多上下文管用。
本研究系统性地向Codex代码代理注入不同粒度的静态结构注释(如调用图、继承拓扑),发现轻量级拓扑可将函数级定位准确率(Func@5)提升2.2个百分点,并减少1.6轮交互。静态锚点使代理的链接跟随率从0.15-0.18提升至0.21-0.24,单次运行通过率(Pass@1)增加3.4个百分点,同时运行方差减半。但代价是增加约10%的输入token,且稠密语义存在边际效益递减。研究建议中等规模项目默认使用轻量级拓扑,大型仓库裁剪前向边,隐式依赖场景才采用密集标签。
AI 翻译 · 中文
本研究系统性地向Codex代码代理注入不同粒度的静态结构注释(如调用图、继承拓扑),发现轻量级拓扑可将函数级定位准确率(Func@5)提升2.2个百分点,并减少1.6轮交互。静态锚点使代理的链接跟随率从0.15-0.18提升至0.21-0.24,单次运行通过率(Pass@1)增加3.4个百分点,同时运行方差减半。但代价是增加约10%的输入token,且稠密语义存在边际效益递减。研究建议中等规模项目默认使用轻量级拓扑,大型仓库裁剪前向边,隐式依赖场景才采用密集标签。
LLM-based code agents navigate repositories through keyword search but miss the structural relationships, such as call graphs, inheritance hierarchies, and configuration dependencies, that define how software actually wo…