01:10Milvus@milvusio精选Milvus 尝试跳过压缩步骤,直接在文档完整 embedding list 上建立 HNSW 图索引。该方法在 TREC-COVID 上 nDCG@10 达 0.98,远超 MUVERA、LEMUR 等方法的 0.87-0.89。端到端检索中 TREC-COVID 分数 0.516 与 BruteForce 完全持平,MS MARCO 上 0.957 接近精确上限的 0.966。但构建成本显著增大:MS MARCO 平均长度 87 时耗时 6 倍,TREC-COVID 长度 236 时达 18 倍。对于 ColQwen2 等每文档含 5143 个 patches 的长向量,该方法成本过高无法实用。实验揭示当前近似策略的质量损失主要源自向量压缩步骤而非 HNSW 索引本身。AI模型HNSWMilvus嵌入列表索引向量检索近似搜索推荐理由:Milvus 把 embedding 列表直接塞进 HNSW,质量几乎追上暴力搜索,比 MUVERA 高了一截,但成本也翻了 6-18 倍,长文档还不支持。适合对精度有极致需求的项目。原文
23:56Milvus@milvusioLEMUR 是一种将多向量压缩为单向量的策略,声称无需调参、数据驱动。但研究发现,在文档长度差异大的语料(如 LoTTE,长度范围 400 倍)上,LEMUR 会学习到“长文档得分更高”的偏差,导致按长度而非相关性排序。在 LoTTE 上,LEMUR 的 nDCG@10 仅 0.109,召回率 30.5%,而 Exact MaxSim 方法达 0.722 和 98%。问题根源在于 LEMUR 的训练标签(MaxSim 分数)天然偏向长文档,MLP 学到了长度信号。建议用户检查语料的长度分布(P90/P10 比)和模型的可分离性(MaxSim 标准差),若长度差异大或可分离性高,应改用 TokenANN 或 MUVERA。已使用 LEMUR 的团队可通过长度分层采样缓解偏差。论文向量检索多向量压缩长度偏差LEMURMilvus推荐理由:做向量检索的团队注意了——LEMUR 在长尾语料上会悄悄按文档长度排序而非相关性,LoTTE 上召回率从 98% 掉到 30.5%。如果你的语料长度差异大(P90/P10 > 20),建议先跑文中的两个检查再决定是否用 LEMUR。原文
00:49Qdrant@qdrant_engineQdrant 在 Vector Space Day 上联合 Adobe 展示了一种结合向量搜索与图治理层的企业级检索架构。该方案通过 Qdrant 实现快速向量检索,同时利用 Neo4j 的图数据库确保检索结果符合用户身份、权限和策略。现场演示显示,同一查询会根据不同用户的治理规则返回不同结果,而不仅仅是基于相关性排序。这一架构解决了企业 AI 中检索速度与安全合规之间的核心矛盾。AI产品向量检索图数据库权限治理企业AIQdrant推荐理由:企业 AI 团队终于有了兼顾速度与权限的检索方案——Qdrant + Neo4j 的架构直接解决了「谁可以看什么」的治理难题,做企业级 RAG 或智能体系统的开发者值得关注。原文
22:21Qdrant@qdrant_engineQdrant 举办的 Vector Space Day 活动邀请到 Neo4j 开发者关系副总裁 Stephen Chin,他将分享上下文图如何赋予智能体关系理解能力,使其不仅能检索,还能真正推理。活动将于 6 月 11 日在旧金山 The Midway 举行,聚焦智能体与内存的生产级应用、从云到边缘的检索以及多模态 AI。已有 300 多位 AI 构建者报名参加。行业智能体向量检索知识图谱Neo4jQdrant1 个信源在谈推荐理由:做智能体或 RAG 系统的开发者,如果发现向量检索经常答非所问,这场演讲会点出关键缺失——关系理解。建议关注活动内容或后续回放。原文