Weaviate@weaviate_io精选67Weaviate 1.37 版本新增了最大边际相关性(MMR)算法,用于解决向量搜索中返回高度相似重复结果的问题。通过一个参数 selection= Diversity.MMR(limit=5, balance=0.5),算法在每次选择结果时惩罚与已选结果过于相似的候选,确保最终结果既相关又多样。balance 参数可调节多样性与相关性的权重,0.0 为最大多样性,1.0 为标准搜索。该功能适用于所有 near_* 查询,特别适合检索密集型智能体和标准 RAG 管道,能有效利用上下文窗口,避免浪费 slots。AI产品向量搜索MMRWeaviateRAG检索多样性推荐理由:做 RAG 或智能体检索的团队,终于不用被五个语义相同的 chunk 塞满上下文了——Weaviate 的 MMR 一行参数就能让结果既相关又多样,值得直接上手试。
arXiv cs.AI@Zijun Jia, Yuanchang Ye, Sen Jia, Yiyao Qian, Haoning Wang, Baojie Chen, Diyin Tang, Jinsong Yu, Zhiyuan Wang精选58BalanceRAG 提出了一种针对级联检索增强生成(RAG)系统的联合风险校准方法。传统级联RAG会先尝试仅用大模型回答,不确定时再启用RAG,但各阶段独立校准可能过于保守。BalanceRAG 将阈值对视为二维网格上的操作点,通过序贯图形测试识别安全操作点,实现系统级错误率控制。该方法支持多风险校准,能在保证风险水平的同时保留更多样本,减少不必要的检索调用。在多个开放域问答基准测试中,BalanceRAG 在满足预设风险水平的前提下,提高了覆盖率和正确样本接受数。论文RAG风险校准级联系统问答大模型推荐理由:做RAG系统优化的团队终于有了一个能精确控制风险与检索成本的校准工具——BalanceRAG 用联合阈值替代逐级保守校准,在保证准确率的同时减少不必要的检索调用,建议做问答系统的开发者点开看看。
arXiv cs.AI@Roman Prosvirnin, Sergei Kuznetsov, Seungmin Jin精选67ContextRAG 提出了一种无需大模型进行实体和关系抽取的图RAG系统,通过残差量化k-means和形式概念分析构建模糊概念图,显著降低了索引阶段的token消耗和延迟。在130任务的UltraDomain子集上,ContextRAG仅需30次LLM调用和22,073个token完成索引,而对比方法HiRAG在20任务上就需要870次调用和354万token。ContextRAG在整体F1上达到33.6%,多跳任务F1为36.8%。分析表明,检索到格派生节点的查询比未检索到的F1高出3.9个百分点。该方法为构建高效、低成本的图RAG系统提供了新思路。论文RAG图构建多跳问答形式概念分析效率优化推荐理由:做RAG系统优化的团队终于有了一个不依赖LLM抽取的图构建方案——ContextRAG用30次调用替代了数百万token的索引开销,多跳问答效果还更好,做知识密集型问答的开发者值得一试。
arXiv cs.AI@Gioele Molinari, Florian Felten, Soheyl Massoudi, Mark Fuge精选72EngiAI 是一个针对大型语言模型(LLM)在工程设计任务中应用的多智能体框架与基准套件。该基准包含三个评估维度:工作流基准(7种提示风格,涵盖直接工具使用、语义消歧、条件分支等)、检索增强生成(RAG)基准(通过门控评分隔离检索对参数选择的贡献)以及高性能计算(HPC)基准(评估SLURM集群上的端到端ML训练编排)。EngiAI 参考实现基于LangGraph,通过监督架构协调7个专业智能体,统一拓扑优化、文档检索、HPC作业编排和3D打印机控制。在Beams2D问题上,专有模型平均任务完成率达96-97%,而开源4B参数模型为55-78%,条件分支任务最具挑战性(Photonics2D上完成率降至20-53%)。RAG门控验证了检索增强评分接近完美(≈1.0),而无检索时接近零,HPC编排中一个模型100%完成所有步骤,另一个仅50%,揭示了多步骤指令遵循在长工作流中会退化。论文多智能体系统工程设计基准测试LangGraphRAG推荐理由:做工程设计自动化或LLM多智能体系统的开发者,这个基准能帮你精准定位模型在条件分支、RAG和HPC编排上的短板,建议直接参考EngiAI框架来测试自己的方案。
Jerry Liu@jerryjliu0精选67PwC发布论文《Is Grep All You Need?》,研究Agent搜索中不同检索工具的效果。他们让Agent同时使用向量搜索和grep,发现grep在准确率上普遍优于语义搜索。论文测试了多种Agent框架(包括Claude Code、Codex),但局限在于检索对象是对话记忆而非企业文档。作者认为Agent框架确实简化了检索问题,但仍有改进空间。论文Agent搜索grep语义搜索RAGPwC推荐理由:这篇论文挑战了“语义搜索是Agent标配”的直觉,做Agent检索或RAG的开发者值得一读,看完可能会重新审视你的检索策略。