23:00Milvus@milvusio精选向量搜索擅长语义匹配,但搜索精确型号如“XR-2048”可能出错。BM25能精确匹配术语,但会漏掉语义相近的“refund policy”和“return process”。Milvus通过RRF(Reciprocal Rank Fusion)融合向量搜索和BM25结果。配置只需三步:添加稠密和稀疏向量字段、启用内建BM25函数、使用RRFRanker。内建BM25时不要手动插入稀疏向量,外部模型如BGE-M3才需手动提供。技巧MilvusBM25混合搜索向量搜索RRF推荐理由:Milvus官方教混合搜索原文
12:47marktechpost@Asif Razzaq精选72°Nous Research 的 Hermes Agent 新增 Tool Search 功能,用于解决 MCP(模型上下文协议)中的上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制,能有效筛选相关工具。Anthropic 的评估显示,在 Opus 4 模型上,该方案将准确率提升了 49% 到 74%。这一改进对依赖 MCP 的 AI 代理系统意义重大,能显著减少无效信息干扰,提升任务执行效率。AI产品MCP/工具智能体Hermes AgentBM25上下文优化10 个信源在谈推荐理由:MCP 上下文膨胀是 AI 代理落地的常见痛点,Hermes Agent 的 Tool Search 用 BM25 精准筛选工具,做智能体开发的团队可以直接参考这个方案来优化自己的系统。原文
19:11arXiv cs.AI@Tz-Huan Hsu, Jheng-Hong Yang, Jimmy Lin本研究探讨了在构建深度研究系统时,是否仅需词汇检索器BM25配合更强的大型语言模型即可实现高效结果。研究者提出了Pi-Serini搜索智能体,它具备检索、浏览和阅读文档三个工具。在测试集B-Plus上,Pi-Serini搭配gpt-5.5达到了83.1%的答案准确率和94.7%的证据召回率,超过了使用稠密检索的代理。通过调整BM25参数和增加检索深度,答案准确率提升了18.0%,证据召回率提升了11.1%和25.3%。这表明在推理能力更强的LLM辅助下,传统词汇检索仍能发挥重要作用。代码已开源。论文搜索代理检索增强BM25大型语言模型开源/仓库推荐理由:该研究挑战了稠密检索在深度搜索中不可或缺的假设,为构建轻量、高效、不依赖外挂向量库的搜索代理提供了新思路,值得关注推理模型与经典检索技术的结合。原文