检索增强生成

§ 01综述

检索增强生成（Retrieval-Augmented Generation, RAG）是一种将信息检索与语言模型生成相结合的技术，旨在通过从外部知识库中检索相关文档来提升模型回答的准确性与时效性。它有效缓解了纯大语言模型在知识更新、事实一致性方面的固有限制，成为当前AI应用落地的核心范式之一。

检索增强生成近期进展

推理能力与检索的深度融合：RA-RFT 方法提出通过检索增强的强化微调，使模型在推理过程中动态利用外部知识进行类比推理，改善了复杂任务中的知识利用效率。RA-RFT：通过检索增强强化微调实现类比推理

自适应检索策略的优化：针对金融领域，研究者采用市场反馈信号动态调整检索策略，在冻结LLM参数的条件下实现了Sharpe比率0.84的提升，展示了RAG在特定垂直场景中的巨大潜力。Frozen LLM金融RAG：市场反馈自适应检索提升Sharpe至0.84

RAG与其他模型架构的结合：SARDI 将扩散语言模型与自增强检索结合，通过迭代检索-生成循环提升文本质量，开辟了RAG在非自回归生成模型中的应用方向。SARDI：扩散语言模型的自增强检索方法

面向结构化数据的检索增强：统计嵌入方法专注于数值表格数据的相似性检索与可解释对齐，扩展了RAG处理非文本数据的能力边界。统计嵌入：数值表格数据的相似性检索与可解释对齐方法

当前焦点与观察点

当前检索增强生成领域的讨论围绕几个关键问题展开：一是大上下文窗口对向量搜索的冲击，Qdrant 的基准测试指出，虽然长上下文模型提供了新的可能性，但向量检索在效率、精准度上仍不可替代；二是检索质量与生成质量的关系，Milvus 强调诊断检索环节是解决RAG问答错误的第一步，而非急于更换大模型；三是RAG系统在少数族裔敏感内容审核等社会责任应用中的表现，研究表明结合检索可以使审核更精准；此外，智能体时代对RAG的要求进一步升级，独立编码智能体需要更高质量的检索结果来支撑自主决策。总体而言，RAG正从简单的“检索+生成”向更智能、更领域化、更鲁棒的方向演进，其成功落地仍依赖于检索链路每个环节的持续优化。

§ 02相关报道10 条在档

§ 03邻近话题