10:29arXiv cs.AI@Melissa Z. Pan, Negar Arabzadeh, Mathew Jacob, Fiodar Kazhamiaka, Esha Choukse, Matei Zaharia精选现代检索Agent面临大量配置选择(如LLM、检索器、文档数量等),传统方法按工作负载静态调优,忽略了查询级别的优化空间。研究者提出BRANE系统,利用LLM将自然语言查询转化为工作负载特征,再训练轻量级预测器评估各配置的准确性。在推理时,BRANE根据成本与准确率目标自动选择最优配置,无需重新训练。在MuSiQue、BrowseComp-Plus和FinanceBench上,BRANE以最高89%的成本降低达到最佳固定配置的准确率,并优于LLM路由、规则和微调Qwen3-4B基线。这表明查询级别的全管道配置是静态调优的实用替代方案。论文检索Agent配置优化成本-质量权衡BRANELLM路由推荐理由:检索Agent的配置优化是成本与质量的永恒博弈,BRANE让每个查询都能自动找到最优解,做RAG或搜索系统的团队可以直接参考其方法,省下大量手动调参时间。原文