21:45shao__meng@shao__meng精选LoanLens基于LandingAI构建,从6类借款人文档中结构化抽取字段,进行姓名一致性TF-IDF比对(相似度低于0.95告警)和护照篡改检测(比对核心组件位置与参考几何)。评分模型透明可解释:信用权重23%、DTI 23%、收入时效20%等,总分≥60批准,40-59复核,<40拒绝。系统附带仅限当前案件的RAG问答,支持字段溯源与人工检查。AI产品LandingAILoanLens欺诈检测RAG文档理解推荐理由:这套LoanLens系统把审贷初筛自动化,用结构化字段和可解释评分替代黑盒OCR,欺诈检测能抓文档篡改,审核员能直接查每个字段的证据。原文
11:39IT之家(博客/媒体)Mistral AI 于6月23日发布OCR 4文档识别模型。该模型支持横跨10个语族的170种语言,在OmniDocBench基准上获得93.07分,优于GPT 5.5 Pro和Gemini 3.1 Pro Preview。OCR 4提供边框、区域分类和置信度评分,并支持RAG语义分块等下游任务。基础API定价每千页4美元,批处理可享50%优惠。AI模型Mistral AIOCR 4多模态文档识别RAG3 个信源在谈推荐理由:Mistral出了新OCR模型,支持170种语言,评分比GPT和Gemini都高,处理文档识别可以试试它。原文
08:00Qdrant@qdrant_engineQdrant联合Kaivid Labs创始工程师Tarun演示如何构建完全离线的RAG系统,使用Qdrant EDGE进行轻量级设备端向量搜索,搭配Google LiteRT通过硬件加速运行语言模型,实现文档问答、个人助理和笔记搜索,无需任何云依赖。活动时间为7月7日,包含现场实操。技巧Qdrant EDGEGoogle LiteRTRAG本地推理向量搜索推荐理由:教你用Qdrant EDGE和Google LiteRT搭一个完全离线的RAG系统,文档问答、个人助理全在本地跑,再也不用担心隐私和联网了。原文
04:42Gary Marcus@GaryMarcus精选一项使用1720亿token的测试发现,LLM在文档问答中无法完全避免幻觉。最佳模型在32K上下文编造答案率为1.19%,强模型通常为5%-7%,中等模型约25%。当上下文扩展到200K时,所有模型编造率至少10%。研究表明幻觉不仅源于检索失败,模型在事实缺失时仍过度自信回答。论文LLM幻觉文档问答上下文长度RAG推荐理由:别以为用文档就能让LLM老老实实回答,1.19%的幻觉率也是定时炸弹,尤其长上下文风险更高。原文
00:36Milvus@milvusio精选单个1-5分的RAG质量评分会隐藏严重问题:一个回答90%基于文档,但10%虚构核心参数就不可用,平均分仍显示4分。幻觉分布也不均匀,数值查找或多条件问题类型的幻觉率远高于平均,不按类型分桶就看不到偏差。优化答案相关性时,添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识,降低忠实度。更可靠的方法是声明级评估:将回答拆成原子事实,用NLI模型检查每个声明是否被检索内容支撑,计算接地率,并对关键参数设置硬性阻断。按问题类型分桶评分,Milvus可用标量字段直接过滤分析,不依赖额外报表管线。技巧RAGMilvus评估幻觉声明级评估推荐理由:如果你在用RAG做生产系统,这篇讲透了为什么平均分不靠谱,还给了按声明颗粒度和问题类型精准监测的方法,连Milvus怎么分桶都说了,很实用。原文
17:28berryxia@berryxia这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出,作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制(HITL)在关键操作前插入人工检查点。技巧MCPAnthropic智能体智能体循环RAG10 个信源在谈推荐理由:想搭AI智能体但怕底层理论?这篇用7个点讲透架构,从MCP到记忆系统,普通开发者也能快速落地。原文
09:40arXiv: OpenAI@Nikolaos D. Tantaroudas, Ilias Karachalios, Andrew J. McCracken论文介绍了Falco eleonorae,一个面向希腊小岛农民的双语(希腊语主、英语次)对话式AI助手。系统利用OpenAI GPT-5家族模型进行回答生成,并通过MCP工具查询本地作物、季节性日历、方言词汇等结构化数据。它支持语音输入(使用欧盟流式语音转文字服务)和图像描述(由视觉模型处理),并设计为渐进式Web应用以适应低带宽环境。作者论证,对于资源受限的农村部署,这种托管式检索增强方案比自托管模型更可靠且更易实现。论文Falco eleonoraeGPT-5MCP/工具多模态RAG5 个信源在谈推荐理由:OpenAI的GPT-5给希腊农民做了个接地气的AI助手,能说方言、看图、查作物日历,比通用聊天更实用。原文
06:22Ate-a-Pi@svpino精选Lena开源了一个RAG助手,用于导航航空公司政策,包含完整源代码和视频讲解。该应用使用LangChain构建检索管道,LangGraph管理对话状态,通过pgvector在Postgres中存储嵌入。项目还使用Terraform部署基础设施,索引文档以将答案锚定在源文本上。开发者可以从中学习具体的工程决策和实现细节。技巧LangChainLangGraphpgvectorRAG开源项目推荐理由:Lena把整个RAG应用的源码和讲解视频都开源了,用LangChain+LangGraph搭建,还用了pgvector和Terraform,想学RAG实战的可以直接拿走。原文
00:15Milvus@milvusio精选Milvus团队指出LLM在RAG中频繁引用了不支持的来源。引文失败分为两类:忠实性错误(生成内容与检索文档不符,如模型声称150W功耗但文档只说低功耗)和引文准确性错误(元数据映射错误、缺失引用、幽灵引用、弱支持引用、过度引用)。其中幽灵引用常因索引重建后ID过期导致。修复方案因错误类型而异:忠实性问题调整生成层约束或基座模型,引文准确性问题需工程层修复元数据管理。技巧RAG引文忠实性检索增强生成Milvus推荐理由:别总怪模型了,很多引文错误出在工程层。这篇文章帮你分清五种引文故障,对症下药。原文
07:48marktechpost@Asif Razzaq精选Mistral AI 于2026年6月23日发布 OCR 4,从纯文本提取升级为结构化文档输出。每个文本块返回边界框、类型分类以及每页和每词的置信度分数。该模型支持170种语言,可在单个自托管容器中运行,通过单一API端点向RAG、智能体和企业搜索管道提供可引用的输入。AI模型MistralOCR 4RAG智能体企业搜索推荐理由:Mistral 出了 OCR 4,能提取带边界框和置信度的结构化内容,方便直接用于 RAG 和搜索,支持170种语言还自托管,很实用。原文
01:00AWS Machine Learning Blog@Yuan Tian这篇博客展示如何用Amazon Bedrock AgentCore构建一个对话式蛋白质研究助手。它通过自然语言解析提取结构化搜索参数,基于蛋白质语言模型进行向量相似性搜索。搜索结果会自动生成AI科学摘要,无需手动编码查询逻辑。整个过程涵盖查询解析、向量检索和摘要生成三步。技巧Amazon Bedrock蛋白质研究智能体RAG推荐理由:想建一个能聊蛋白质研究的智能助手?这篇教程用Bedrock AgentCore教你搞定,自动解析问题、向量搜蛋白质,还能生成摘要。原文
14:55marktechpost@Sana Hassan精选本教程使用 Crawlee for Python 搭建完整的网页爬取工作流。通过 BeautifulSoupCrawler、ParselCrawler 和 PlaywrightCrawler 分别爬取静态与动态内容,提取标题、元数据和产品字段。教程还演示如何构建链接图,并将数据导出为 JSON、CSV 以及 RAG 就绪的 JSONL 分块文件。最后附带 robots 处理与截图功能,从设置到 AI 输出一步到位。技巧CrawleePythonBeautifulSoupParselPlaywright爬虫RAG推荐理由:想用 Python 从零搭一套能把网页内容直接喂给 RAG 的爬虫管道吗?这篇保姆级教程教你用 Crawlee 搞定 robots、截图和分块导出。原文
02:23Harrison Chase@hwchase17一位开发者推荐了一个近10小时的agentic AI教程,内容覆盖LangChain、LangGraph、RAG、deepagents和guardrails等关键工具。该课程旨在帮助学习者构建和部署智能体系统。资源来自YouTube,适合初学者和进阶用户参考。技巧LangChainLangGraphRAGdeepagents智能体教程推荐理由:这个课程10小时,手把手教LangChain和LangGraph,还讲了RAG和guardrails,想学智能体开发可以看看。原文
09:53arXiv cs.LG@Ali Asaria, Tony Salomone, Deep Gandhi论文使用Qwen2.5-7B-Instruct对比了零样本、仅SFT、仅RAG和SFT+RAG混合四种方法在安大略住宅租赁法条文引用上的效果。混合方法以0.481精确匹配(节+条)取得最高分,且将幻觉降至零。SFT提升了高召回候选集中条款选择的鲁棒性,而仅用bge-small嵌入就超越了更大专用检索模型。扩大训练集未带来提升,0.70目标尚未达到。论文Qwen2.5-7BRAGSFT零幻觉法律引用推荐理由:这篇论文用Qwen2.5-7B做了个四路对比,发现微调加检索混合方案在法条引用上精确匹配0.481还零幻觉,比纯微调或纯检索都强,而且用轻量bge-small就够用。原文
09:37arXiv: OpenAI@Jose Manuel Suarez, Luis Mariano Bibbo, Joaquin Bogado, Alenandro Fernandez论文提出一种结合大语言模型与检索增强生成(RAG)的混合方法,自动迁移Qiskit代码版本。该方法利用自动生成的迁移场景分类作为结构化的版本特定知识源。实验评估了Google Gemini Flash-2.5和OpenAI Gpt-oss-20b两种模型,在限制性检索方案下显著减少幻觉,提升描述质量。Google Gemini Flash-2.5在检测复杂重构场景中表现更优。研究证实了数据驱动方法在量子软件工程中的潜力。论文Qiskit代码迁移RAGGoogle Gemini Flash-2.5量子软件工程10 个信源在谈推荐理由:量子开发者福音!用LLM+RAG自动搞定Qiskit代码跨版本迁移,减少手动返工。Google Gemini Flash-2.5效果最佳,值得看看。原文
06:02Dify@dify_aiDify指出企业AI项目常犯的错误是花数月时间重建模型编排、知识检索、监控、权限等底层平台。一个生产就绪的AI平台应直接提供模型灵活性(可切换供应商)、内置RAG(基于自有数据)、工作流编排(业务人员可读)以及监控与访问控制。这样IT团队就能专注交付业务价值,更快将更多应用推上线。技巧Dify企业AIAI平台RAG工作流编排推荐理由:Dify告诉你别重复造轮子,用现成平台更快把AI应用推上线,专注业务价值少踩坑。原文
19:25Dify@dify_ai76°Dify 宣布 MongoDB Atlas 和 Voyage AI 原生接入其工作流。MongoDB Atlas 提供数据存储层,Voyage AI 通过嵌入和重排序提升检索质量。Dify 编排智能体和工作流层,用户无需自建基础设施即可构建 RAG 应用。MongoDB 团队还贡献了一个可直接使用的 RAG 模板,已上线 Dify 模板市场,帮助团队快速从想法到可运行应用。AI产品DifyMongoDB AtlasVoyage AIRAG智能体推荐理由:Dify 现在原生集成了 MongoDB Atlas 和 Voyage AI,做 RAG 不用自己拼基础设施了,还有现成模板,搞知识助手或推荐智能体更省事。原文
09:31arXiv: DeepSeek@Esteban Schafir, Xu Zheng, Hojat Allah Salehi, Zhuomin Chen, Mo Sha, Wei Cheng, Dongsheng Luo精选DecoSearch是一个无需训练的Text-to-SQL框架,通过轻量级Schema Selector修剪数据库模式,LLM Judger判断查询是否需要分解为DAG子问题。在BIRD上达到70.53%执行准确率,在Spider上达88.31%,使用DeepSeek作为骨干模型,比训练无关基线消耗少一个数量级的token。该方法还可作为模型无关包装器,一致提升微调后的SQL生成骨干性能。AI模型DecoSearchDeepSeekText-to-SQL推理模型RAG推荐理由:DecoSearch不用训练就能把自然语言转SQL,在BIRD和Spider上准确率分别超70%和88%,比同类方法省十倍token。想提升SQL生成效率可以看看。原文
01:31Martin Fowler@martinfowlerMartin Fowler 与 Bayer 合作,使用 AI 帮助制药研究人员从大量 PDF 报告中查询数十年的信息。Sarang Sanjay Kulkarni 描述了从关键词搜索到能够起草监管报告的研究助手的演进过程。该文章详细介绍了如何构建可靠的 AI 查询系统,提升制药研发效率。技巧BayerMartin FowlerRAGPDF查询监管报告推荐理由:Martin Fowler 分享了和 Bayer 合作的 AI 应用,能从海量 PDF 里找到信息甚至帮你写报告,挺实用的原文
16:28marktechpost@Asif Razzaq精选Google Cloud发布Open Knowledge Format (OKF),一种供应商中立的Markdown规范,旨在让AI智能体获取经过策划的上下文知识。OKF采用bundle结构——包含YAML frontmatter的Markdown文件目录,每个概念只需指定type字段。该规范遵循三个核心设计原则,并附带参考实现工具。与传统的RAG(检索增强生成)不同,OKF强调知识的结构化与策划,而非纯向量检索。官方还提供了可运行的Python消费示例和交互式bundle探索工具。行业OKFGoogle CloudAI AgentMarkdownRAG推荐理由:Google Cloud搞了个OKF,用Markdown加YAML给AI Agent喂知识,比RAG更结构化。有代码和工具可直接上手。原文
09:52arXiv cs.LG@Weihang Su, Jiacheng Kang, Jingyan Xu, Qingyao Ai, Jianming Long, Hanwen Zhang, Bangde Du, Xinyuan Cao, Min Zhang, Yiqun Liu论文提出ReGrad(Retrievable Gradients)范式,将梯度视为可检索的知识单元。方法预先离线计算文档特定梯度并存入索引梯度库,推理时仅检索查询相关梯度进行临时权重适应。为解决原始语言建模梯度不适于查询驱动知识使用的问题,引入双层元学习目标重塑梯度为通用适应信号。实验在通用和领域特定设置中表明,ReGrad优于CPT和RAG基线,实现可扩展且可逆的参数化知识注入,不累积权重漂移。论文ReGradCPTRAG持续学习可检索梯度推荐理由:这篇论文提出了ReGrad,把梯度当知识存起来,推理时才取用,不破坏原有模型参数,效果比CPT和RAG都好。原文
21:51Qdrant@qdrant_engine本文介绍如何使用 Qdrant 和 Evret 构建检索系统评估流程,涵盖构建基准、衡量检索质量、评估相关性和排序性能,以及超越“看起来有效”的测试。随着 RAG 和检索系统在生产 AI 应用中日益关键,评估变得与检索本身同等重要。AI产品RAG检索系统评估QdrantEvret推荐理由:做 RAG 或检索系统的开发者终于有了可落地的评估方法论——Qdrant + Evret 的组合让你从“感觉还行”到“数据说话”,建议直接跟着指南搭建你的评估流水线。原文
01:32Weaviate@weaviate_ioWeaviate 推出了包含 7 个可运行演示的新 playground,涵盖 AI 记忆、欺诈检测、电商搜索、聚类分析、向量搜索对比、护肤推荐和智能体决策树等场景。每个演示都提供可直接复制粘贴的提示词,方便开发者快速上手构建。其中 Engram 演示展示了 AI 智能体的持久记忆能力,能跨对话回忆事实和摘要;欺诈检测演示则通过查询智能体将自然语言问题转化为结构化查询,发现交易模式。Weaviate 还推出了免费永久层,鼓励开发者免费开始构建。AI产品Weaviate向量数据库RAG智能体演示/Playground推荐理由:做 AI 应用和智能体开发的团队,可以直接用这些演示模板快速验证想法,尤其是 Engram 的持久记忆和欺诈检测的查询智能体,值得立刻试试。原文
22:17Qdrant@qdrant_engine精选该项目利用 Qdrant Edge 的向量搜索和边缘 RAG 技术,在不训练自定义机器学习模型的情况下实现火灾检测。系统将实时传感器读数与本地已知模式进行比对,实现快速、隐私优先的本地推理。这种方法避免了训练和维护专用模型的负担,适合资源受限的环境。项目展示了边缘计算与向量搜索在实时异常检测中的创新应用。AI产品Qdrant Edge向量搜索边缘计算火灾检测RAG推荐理由:做物联网或边缘计算的开发者可以省去模型训练的麻烦——Qdrant Edge 的向量搜索直接匹配已知模式就能检测火灾,隐私和效率都兼顾,值得试试。原文
16:52Geek@geekbb一位 AI 观察者感叹技术迭代速度惊人,RAG、MCP、提示词工程等概念在短短时间内已显得过时。这反映了 AI 领域创新周期急剧缩短,新范式不断涌现。对于从业者而言,持续学习和适应成为必备能力。行业AI 趋势技术迭代RAGMCP提示词工程推荐理由:这条推文戳中了 AI 从业者的焦虑点——技术淘汰速度比想象中更快,做 AI 产品或研究的团队看完会有感触,值得停下来反思自己的技术栈是否还跟得上。原文
15:14Jerry Liu@jerryjliu0LlamaIndex创始人Jerry Liu在X上提出,Agent文件系统正在成为新的RAG模式。他认为这一趋势将持续并变得更加稳健。Agent不仅需要读取和搜索文档的工具,还需要完整的基础设施和应用层来生成新文件、与人类协作、组织和管理信息。Jason Goodison补充说,为Agent构建无服务器文件系统是一个价值10亿美元的机会。这反映了AI Agent从单纯检索向主动文件管理和协作的演进。AI产品Agent文件系统RAGAI Agent基础设施协作推荐理由:如果你在构建AI Agent或关注其基础设施演进,Jerry Liu的这个观察点明了下一个关键方向——Agent需要自己的文件系统来管理生成和协作。做Agent框架或应用的开发者值得关注这个趋势。原文
12:49arXiv cs.AI@Hudson de Martim精选本文指出,检索增强生成(RAG)在法律AI中的失败并非简单的模型幻觉,而是概率检索与法律知识层次、时间性和制度结构之间的架构不匹配。作者从法律理论出发,提出法律知识具有层次性、动态性和因果可追溯性三个本体论属性,并对应识别出三种检索病理:整体性盲视、历时性盲视和因果不透明性。通过分析现有方法,作者认为它们未能将这些要求视为共同构成性因素,并提出了四个确定性设计方向:本体优先、事件具体化、双时正确性和确定性交互协议。该框架主要关注法律规范适用问题,而非下游任务。论文RAG法律AI知识检索架构分析确定性设计推荐理由:法律AI从业者终于有了一个严肃的理论框架来理解RAG的失败原因——不是模型不够大,而是检索架构与法律知识的本质不匹配。做法律科技或合规自动化的团队,建议仔细读读这篇,能帮你避开很多坑。原文
10:29arXiv: DeepSeek@Jianguo Zhu精选研究者发现了一种针对检索增强生成(RAG)系统的新型间接提示注入攻击模式,称为DACSI(文档作者控制信号冒充)。攻击者通过编写看似元数据、来源或策略信号的文档文本,让模型误将其视为可信的控制指令,从而绕过安全边界。该攻击无需显式命令,利用RAG将用户查询、检索文档和系统标签混合到同一自然语言提示中的设计缺陷。在DeepSeek V4 Pro、Qwen3.5-397B等6种模型上的实验表明,该攻击在多数模型上有效,尤其在高易感性设置中。研究建议通过源/通道分离来缓解此类攻击。论文RAG提示注入安全攻击DeepSeekQwen推荐理由:RAG系统开发者需要警惕这种低成本、隐蔽的间接注入方式——它不依赖命令,而是冒充元数据,做AI安全的团队建议仔细看论文中的缓解方案。原文
00:48Milvus@milvusioMilvus 3.0 是该项目自启动以来最重要的架构更新,引入了数据湖原生向量索引和查询能力,突破了传统 top-K 搜索限制。核心维护者 Li Liu 和 Jiang Chen 将在 6 月 8 日的网络研讨会上详解设计决策、新特性以及如何驱动 Zilliz Vector Lakebase。研讨会包含 15-20 分钟 AMA 环节,适合构建 RAG、多模态搜索、推荐系统和 AI 智能体记忆的开发者。无法参加直播可注册获取回放。AI产品Milvus向量数据库数据湖RAGZilliz推荐理由:Milvus 3.0 解决了数据孤岛和 schema 演进等痛点,做 RAG 或向量搜索的团队值得关注这次架构升级的细节。原文
12:09arXiv: DeepSeek@Jianguo Zhu精选本文研究了在上下文增强的语言模型系统中,使用不同话语角色标签(如 Reference:、Evidence:、Instruction:、Note:、Example:)对模型行为的影响。通过设计 500 个 MMLU-Pro 项目的配对固定内容探针,每个项目在相同误导性断言下使用不同标签,测量模型输出错误选项的采纳率。在 GPT-5.5、DeepSeek V4 Pro、Llama-3-8B-Instruct 和 Qwen2.5-7B-Instruct 上,误导采纳率变化达 56-84 个百分点。Instruction: 和 Reference: 等绑定或来源类标签导致高采纳,而 Example: 则持续抑制采纳。边界探针显示算术任务降低采纳率,嵌套标签冲突表明示例性框架可限制采纳范围。结论是上下文利用和 RAG 基准应报告并控制包装标签,因为呈现方式会改变对提供上下文的依赖度量。论文语言模型上下文利用RAG标签影响误导采纳率推荐理由:这篇论文揭示了标签选择能显著改变模型对误导信息的采纳率(最高差 84 个百分点),做 RAG 系统或上下文增强应用的开发者需要警惕:你用的标签可能无意中放大了错误信息的影响。建议点开了解如何控制这一变量。原文
23:35Milvus@milvusio固定长度分块将文档切成512或1024 tokens的块,但可能把完整答案切半导致检索不完整。滑动窗口分块用50-100 tokens重叠避免断句,但会产生重复块挤占检索结果。语义分块按段落、标题或章节分割保持语义完整,但只适用于格式规整的文档。Milvus建议对技术文档用语义分块+滑动窗口兜底,对话记录用大重叠固定分块,API文档按章节分块。技巧MilvusRAG文档分块检索增强生成推荐理由:Milvus教你按文档类型选分块方法原文
10:51Weaviate@weaviate_io精选Weaviate 指出,RAG Agent 在生产环境中的成败不取决于模型,而取决于系统设计的四个基础层:安全、检索、指令和护栏。许多团队止步于演示阶段,但实际部署中会出现幻觉、输出不一致、安全漏洞等问题。可靠的 Agent 需要在这些层面进行严格设计,才能从演示变成真正可信的系统。文章提供了免费技术指南,涵盖高级 RAG 技术、工作流架构和安全实践。AI产品RAGAgent系统设计安全生产部署推荐理由:做 RAG 应用的团队别再只盯着模型了——这篇把生产环境踩坑的四个关键层讲透了,建议做 Agent 架构的开发者点开看看,能省不少试错成本。原文
01:41Milvus@milvusioRAG系统上线后召回率下降,常见原因包括:索引过期(新文档加入、旧文档修改或删除,但向量索引未更新)、嵌入模型变更(如OpenAI更新模型导致新旧向量不匹配)、用户提问方式变化(用户群体和产品变化导致查询分布偏移)。此外,测试集可能已偏离真实场景,掩盖了召回率下降的问题。这些因素会导致检索结果不准确,影响RAG系统性能。AI产品RAG召回率向量索引嵌入模型测试集漂移10 个信源在谈推荐理由:做RAG系统的团队,如果发现线上召回率不如测试时,这三个原因能帮你快速定位问题,建议对照排查。原文
12:02arXiv cs.AI@Yuyang Li, Zihe Yan, Tobias Käfer多跳问答系统通常对每个问题都进行昂贵的检索,包括分解问题、多轮检索或搜索桥接实体,这增加了LLM调用的token成本。但分析发现,许多多跳问题通过单次RAG就能正确回答,因此对每个问题都进行额外检索浪费了预算。RASER是一种基于单次RAG和六个特征构建的廉价路由器,RASER-2决定是停止还是升级到PRUNE(额外检索),RASER-3在单次RAG、PRUNE和迭代检索IRCoT之间选择,且不额外调用LLM。在六个LLM和三个基准测试中,RASER在F1得分上与SOTA基线竞争,但token消耗仅为始终PRUNE的41-49%,且低于迭代和分解检索基线。论文多跳问答RAG路由检索优化成本控制推荐理由:RASER解决了多跳问答中检索成本过高的问题,做RAG系统或问答管线的开发者可以直接用这个轻量路由器来节省token预算,同时保持准确率。原文
11:19Patrick Loeber@patloeberQdrant 在柏林举办多模态搜索工作坊,参与者可以动手实验 Gemini Embedding 2 和 Qdrant 的集成。活动聚焦 AI 检索、智能体和现代搜索系统,探讨在智能体时代检索的演进、生产级 RAG、记忆系统和向量搜索。同一天还将举办 Vector Space Meetup,主题为“智能体时代的检索”,提供交流与网络机会。适合对向量搜索、RAG 和 AI 智能体感兴趣的开发者参加。AI产品向量搜索RAG智能体Gemini Embedding 2Qdrant推荐理由:做向量搜索和 RAG 的开发者可以直接在柏林现场动手试 Gemini Embedding 2 和 Qdrant 的集成,还能和同行交流智能体时代的检索趋势,值得关注。原文
00:41berryxia@berryxia72°百度 PaddlePaddle 发布了 PaddleOCR-VL 1.6,在 OmniDocBench 上达到 96.33% 的 SOTA 成绩,超越开源和商业方案。该版本显著提升了表格识别、稀有字符、印章检测和图表理解能力,尤其适合金融合同、法律文件等复杂文档。与 1.5 版本完全架构兼容,零迁移成本即可使用。高精度解析能力直接提升了 RAG 系统的输入质量,降低了文档智能的门槛。AI产品OCR文档解析PaddleOCR-VLRAG法律金融推荐理由:文档解析是 RAG 和 LLM 应用的关键瓶颈,PaddleOCR-VL 1.6 在复杂场景(表格、印章、稀有字符)上大幅提升,做法律、金融文档处理的团队可以直接替换升级,零迁移成本值得一试。原文
21:36Qdrant@qdrant_engineQdrant在柏林举办两场AI活动,主题围绕AI检索、智能体、现代搜索系统。活动包括讨论检索在智能体时代的演变、生产级RAG、记忆系统和向量搜索。同一天还举办Vector Space Meetup,主题为“智能体时代的检索”。活动面向AI生态系统的开发者、研究者,提供交流与网络机会。行业AI检索智能体向量搜索RAGQdrant推荐理由:对AI检索、智能体或向量搜索感兴趣的柏林开发者,可以现场交流前沿实践,值得参加。原文
08:14Weaviate@weaviate_ioWeaviate 发布了一篇简洁的 AI 智能体术语解释,涵盖 MCP、单/多智能体架构、技能、Agentic RAG 和记忆等核心概念。文章指出记忆是难点,并介绍了其自研的记忆与上下文管理方案 Engram。该内容旨在帮助开发者快速理解智能体相关术语,避免观看冗长的视频教程。AI产品MCP/工具智能体RAG记忆管理Weaviate推荐理由:想快速搞懂 AI 智能体核心概念(MCP、RAG、记忆)的开发者,不用再刷 45 分钟视频了,这篇直接给干货。原文
00:46Milvus@milvusio当 RAG 系统给出错误答案时,团队通常第一时间换更大的模型或调 prompt,但 Milvus 团队指出,真正该先修的是检索环节。他们提出一个三步诊断法:先按查询类型(精确术语、多跳、长尾、不可回答)构建黄金测试集,然后按桶计算 Recall@k,最后根据弱桶定位问题——精确术语桶低说明稠密检索对精确字符串有盲点,应加混合搜索;多跳桶低说明答案被切分或候选集太小;长尾桶低说明用户措辞与文档术语不匹配,需加查询改写;所有桶都低则说明嵌入模型不适合领域。这种方法能精准定位检索失败的具体原因,而非笼统地认为“召回率差”。AI产品RAG检索增强生成Milvus诊断方法召回率推荐理由:做 RAG 的团队别再盲目换大模型了——Milvus 这篇诊断法帮你精准定位检索瓶颈,从精确术语到长尾查询都有对应解法,建议直接收藏实操。原文
21:00LlamaIndex@llama_index精选文章指出grep词法搜索在小代码库或文档文件夹中足够,但在企业环境中面对数百万PDF、电子表格和扫描文档时无法读取、不扩展且忽略同义词。作者分析grep的优势和局限,解释为什么RAG和语义搜索在企业规模下是必要的。最后介绍如何分层结合词法搜索与语义搜索来获得最佳效果。技巧grepRAG语义搜索检索增强生成推荐理由:教你如何搭配grep和RAG做搜索原文