Milvus@milvusio精选58Milvus 团队发文解释了多向量模型在基准测试中表现优异,但在生产环境中效果不如稠密检索的原因。核心问题在于多向量模型使用精确的 MaxSim 评分(每个查询 token 与文档所有 token 比较),而生产环境只能使用近似搜索。稠密检索的近似算法(如 HNSW、IVF)成熟度高,能紧密跟踪精确结果;多向量模型的近似搜索则因压缩或聚合表示导致候选集遗漏,损失更大。实验表明,短文档和简单查询下稠密检索更优,长文档和复杂查询下多向量才值得使用。AI模型多向量检索稠密检索向量数据库Milvus近似搜索推荐理由:做向量检索的团队常遇到多向量模型部署后效果反而不如稠密检索的困惑,Milvus 这篇分析直接点出了根本原因和适用场景,建议做搜索和 RAG 的开发者仔细看看,能帮你避免选型踩坑。