代码代理需要多少静态结构？确定性锚点研究

精选理由

这篇论文用实验告诉你：给代码代理加一点调用图注释，定位准了2.2%，交互少了1.6轮，运行还更稳定。比堆更多上下文管用。

AI 摘要

本研究系统性地向Codex代码代理注入不同粒度的静态结构注释（如调用图、继承拓扑），发现轻量级拓扑可将函数级定位准确率（Func@5）提升2.2个百分点，并减少1.6轮交互。静态锚点使代理的链接跟随率从0.15-0.18提升至0.21-0.24，单次运行通过率（Pass@1）增加3.4个百分点，同时运行方差减半。但代价是增加约10%的输入token，且稠密语义存在边际效益递减。研究建议中等规模项目默认使用轻量级拓扑，大型仓库裁剪前向边，隐式依赖场景才采用密集标签。

AI 翻译 · 中文

arXiv: OpenAILLM-based code agents navigate repositories through keyword search but miss the structural relationships, such as call graphs, inheritance hierarchies, and configuration dependencies, that define how software actually wo…

阅读原文