Anthropic: Engineering(资讯)60Anthropic 发布 Contextual Retrieval 技术,通过为每个文本块添加上下文说明,显著提升检索增强生成(RAG)的准确性。传统 RAG 中,孤立文本块常因缺乏上下文导致检索错误,而 Contextual Retrieval 利用 Claude 模型为每个块生成简短描述,使检索更精准。该方法结合 BM25 和嵌入搜索,在多个基准测试中错误率降低 67%。Anthropic 还提供了高效实现指南,包括使用 prompt caching 降低 1.6% 的成本。AI模型RAGContextual RetrievalAnthropicClaude检索增强推荐理由:做 RAG 应用的开发者终于有了解决上下文丢失问题的实用方案,错误率直降 67%,建议直接看实现指南。
arXiv cs.AI@Tz-Huan Hsu, Jheng-Hong Yang, Jimmy Lin55本研究探讨了在构建深度研究系统时,是否仅需词汇检索器BM25配合更强的大型语言模型即可实现高效结果。研究者提出了Pi-Serini搜索智能体,它具备检索、浏览和阅读文档三个工具。在测试集B-Plus上,Pi-Serini搭配gpt-5.5达到了83.1%的答案准确率和94.7%的证据召回率,超过了使用稠密检索的代理。通过调整BM25参数和增加检索深度,答案准确率提升了18.0%,证据召回率提升了11.1%和25.3%。这表明在推理能力更强的LLM辅助下,传统词汇检索仍能发挥重要作用。代码已开源。论文搜索代理检索增强BM25大型语言模型开源/仓库推荐理由:该研究挑战了稠密检索在深度搜索中不可或缺的假设,为构建轻量、高效、不依赖外挂向量库的搜索代理提供了新思路,值得关注推理模型与经典检索技术的结合。