BRANE：自然语言查询驱动的检索Agent配置优化

精选理由

检索Agent的配置优化是成本与质量的永恒博弈，BRANE让每个查询都能自动找到最优解，做RAG或搜索系统的团队可以直接参考其方法，省下大量手动调参时间。

AI 摘要

现代检索Agent面临大量配置选择（如LLM、检索器、文档数量等），传统方法按工作负载静态调优，忽略了查询级别的优化空间。研究者提出BRANE系统，利用LLM将自然语言查询转化为工作负载特征，再训练轻量级预测器评估各配置的准确性。在推理时，BRANE根据成本与准确率目标自动选择最优配置，无需重新训练。在MuSiQue、BrowseComp-Plus和FinanceBench上，BRANE以最高89%的成本降低达到最佳固定配置的准确率，并优于LLM路由、规则和微调Qwen3-4B基线。这表明查询级别的全管道配置是静态调优的实用替代方案。

AI 翻译 · 中文

arXiv cs.AIModern retrieval agents expose many configuration choices -- LLM, retriever, number of documents, number of hops, and synthesis strategy -- each shaping both answer quality and serving cost. Today, these pipelines are ty…

阅读原文