论文精选

BRANE:自然语言查询驱动的检索Agent配置优化

Natural Language Query to Configuration for Retrieval Agents

精选理由

检索Agent的配置优化是成本与质量的永恒博弈,BRANE让每个查询都能自动找到最优解,做RAG或搜索系统的团队可以直接参考其方法,省下大量手动调参时间。

AI 摘要

现代检索Agent面临大量配置选择(如LLM、检索器、文档数量等),传统方法按工作负载静态调优,忽略了查询级别的优化空间。研究者提出BRANE系统,利用LLM将自然语言查询转化为工作负载特征,再训练轻量级预测器评估各配置的准确性。在推理时,BRANE根据成本与准确率目标自动选择最优配置,无需重新训练。在MuSiQue、BrowseComp-Plus和FinanceBench上,BRANE以最高89%的成本降低达到最佳固定配置的准确率,并优于LLM路由、规则和微调Qwen3-4B基线。这表明查询级别的全管道配置是静态调优的实用替代方案。

AI 翻译 · 中文

现代检索Agent面临大量配置选择(如LLM、检索器、文档数量等),传统方法按工作负载静态调优,忽略了查询级别的优化空间。研究者提出BRANE系统,利用LLM将自然语言查询转化为工作负载特征,再训练轻量级预测器评估各配置的准确性。在推理时,BRANE根据成本与准确率目标自动选择最优配置,无需重新训练。在MuSiQue、BrowseComp-Plus和FinanceBench上,BRANE以最高89%的成本降低达到最佳固定配置的准确率,并优于LLM路由、规则和微调Qwen3-4B基线。这表明查询级别的全管道配置是静态调优的实用替代方案。

arXiv cs.AIModern retrieval agents expose many configuration choices -- LLM, retriever, number of documents, number of hops, and synthesis strategy -- each shaping both answer quality and serving cost. Today, these pipelines are ty