全部 AI 动态 · AI 热点

6月19日

01:36

01:36

Milvus@milvusio

精选

Milvus指出，仅看平均Recall@5（如85%）会掩盖真实问题。例如，精确术语查询的Recall@5可能只有40%，其他类别拉高了平均值。文章建议将测试用例分为精确术语查询、多跳问题、长尾问题、不可回答问题、权限过滤问题五类，每类至少放5-10个案例分别检查召回率。这样能精准定位检索堆栈中的薄弱环节。

技巧 Milvus 召回率检索评估查询类型向量数据库

推荐理由：Milvus教你怎样真正看懂你的召回率——按5种查询类型拆解，别被一个平均数字骗了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

01:41

01:41

Milvus@milvusio

RAG系统上线后召回率下降，常见原因包括：索引过期（新文档加入、旧文档修改或删除，但向量索引未更新）、嵌入模型变更（如OpenAI更新模型导致新旧向量不匹配）、用户提问方式变化（用户群体和产品变化导致查询分布偏移）。此外，测试集可能已偏离真实场景，掩盖了召回率下降的问题。这些因素会导致检索结果不准确，影响RAG系统性能。

AI产品 RAG 召回率向量索引嵌入模型测试集漂移

推荐理由：做RAG系统的团队，如果发现线上召回率不如测试时，这三个原因能帮你快速定位问题，建议对照排查。

5月29日

00:46

00:46

Milvus@milvusio

当 RAG 系统给出错误答案时，团队通常第一时间换更大的模型或调 prompt，但 Milvus 团队指出，真正该先修的是检索环节。他们提出一个三步诊断法：先按查询类型（精确术语、多跳、长尾、不可回答）构建黄金测试集，然后按桶计算 Recall@k，最后根据弱桶定位问题——精确术语桶低说明稠密检索对精确字符串有盲点，应加混合搜索；多跳桶低说明答案被切分或候选集太小；长尾桶低说明用户措辞与文档术语不匹配，需加查询改写；所有桶都低则说明嵌入模型不适合领域。这种方法能精准定位检索失败的具体原因，而非笼统地认为“召回率差”。

AI产品 RAG 检索增强生成 Milvus 诊断方法召回率

推荐理由：做 RAG 的团队别再盲目换大模型了——Milvus 这篇诊断法帮你精准定位检索瓶颈，从精确术语到长尾查询都有对应解法，建议直接收藏实操。

5月19日

13:07

13:07

Qdrant@qdrant_engine

Qdrant 宣布其向量数据库现已集成 TurboQuant 量化技术。相比现有的 SQ（标量量化）和 BQ（二进制量化），TurboQuant 在相同存储预算下提供比 BQ 更好的召回率，同时达到约 2 倍压缩比且召回率与 SQ 相当。这为需要高效向量存储和检索的用户提供了新的选择。Qdrant 将于 5 月 26 日举办线上技术会议，详解 TurboQuant 原理、基准测试和实际应用场景。

AI产品向量数据库量化 Qdrant TurboQuant 召回率

推荐理由：做向量检索或使用 Qdrant 的团队，TurboQuant 能帮你用更少存储获得更好召回，值得关注 5 月 26 日的技术分享。