全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

01:15

01:15

Milvus@milvusio

Milvus 团队在一条推文中揭示了一个关键发现：在多向量检索中，选择错误的近似检索策略比选错模型带来的性能损失更大。他们使用相同的 Jina-ColBERT-v2 模型和 LoTTE 数据集，仅改变第一阶段近似检索策略，结果 TokenANN 策略的 nDCG@10 达到 0.701，而 LEMUR 策略仅为 0.109，差距约 6 倍。原因是不同策略对模型 token 向量的空间分布（分离度）敏感度不同：对于分布分散的模型（如 Jina），TokenANN 和 MUVERA 效果好；对于分布紧凑的模型（如 AnswerAI），LEMUR 更优。研究者可以通过计算 token 向量 MaxSim 得分的标准差来预判策略选择。

AI模型多向量检索近似检索策略 ColBERT Milvus 检索性能

推荐理由：做向量检索或 RAG 的开发者注意了：多向量检索中策略选择比模型选择更关键，选错策略可能让最好的模型也白费。建议在调优前先测一下 token 向量的分离度，再决定用 TokenANN 还是 LEMUR。