01:34Milvus@milvusio精选Milvus在DocVQA上对比ColQwen(多向量)与Qwen3-VL-Embedding(稠密)的检索性能。精确搜索下,ColQwen3的nDCG@10为0.698,比稠密的0.521高17.7个百分点。近似搜索(LEMUR,ratio=5.0)中,ColQwen3得0.704,领先18.3点,且近似损失几乎为零。在MS MARCO等文本基准上,多向量优势被近似搜索抹平。多向量通过保留表格、图表等空间结构获得提升,适合发票、报告等视觉文档。AI模型ColQwenQwen3-VL-EmbeddingMilvus多模态检索视觉文档检索推荐理由:Milvus用ColQwen和Qwen3-VL-Embedding做了对比,发现多向量在检索带图表的文档时比稠密向量强近18个点,近似搜索不掉分。处理PDF或扫描件可以关注这个结果。原文
10:21Qdrant@qdrant_engineTwelve Labs 的 James Le 将在 Vector Space Day 上展示如何正确构建多模态检索,从体育和音频的语义搜索到处理目标跟踪和高光生成的智能体工作流。视频是信息密度最高的模态,但大多数检索管道仍将其视为带图片的文本。该演讲将展示向量搜索的前沿方向,适合对多模态检索和智能体工作流感兴趣的开发者。AI产品多模态检索向量搜索视频理解智能体Twelve Labs推荐理由:多模态检索是当前向量搜索的关键突破点,做视频理解、智能体或搜索系统的团队值得关注这场演讲,看看 Twelve Labs 如何将视频从“带图片的文本”变成真正的语义搜索对象。原文