全部 AI 动态 · AI 热点

6月24日

01:10

01:10

Milvus@milvusio

精选

Milvus 尝试跳过压缩步骤，直接在文档完整 embedding list 上建立 HNSW 图索引。该方法在 TREC-COVID 上 nDCG@10 达 0.98，远超 MUVERA、LEMUR 等方法的 0.87-0.89。端到端检索中 TREC-COVID 分数 0.516 与 BruteForce 完全持平，MS MARCO 上 0.957 接近精确上限的 0.966。但构建成本显著增大：MS MARCO 平均长度 87 时耗时 6 倍，TREC-COVID 长度 236 时达 18 倍。对于 ColQwen2 等每文档含 5143 个 patches 的长向量，该方法成本过高无法实用。实验揭示当前近似策略的质量损失主要源自向量压缩步骤而非 HNSW 索引本身。

AI模型 HNSW Milvus 嵌入列表索引向量检索近似搜索

推荐理由：Milvus 把 embedding 列表直接塞进 HNSW，质量几乎追上暴力搜索，比 MUVERA 高了一截，但成本也翻了 6-18 倍，长文档还不支持。适合对精度有极致需求的项目。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

23:56

23:56

Milvus@milvusio

LEMUR 是一种将多向量压缩为单向量的策略，声称无需调参、数据驱动。但研究发现，在文档长度差异大的语料（如 LoTTE，长度范围 400 倍）上，LEMUR 会学习到“长文档得分更高”的偏差，导致按长度而非相关性排序。在 LoTTE 上，LEMUR 的 nDCG@10 仅 0.109，召回率 30.5%，而 Exact MaxSim 方法达 0.722 和 98%。问题根源在于 LEMUR 的训练标签（MaxSim 分数）天然偏向长文档，MLP 学到了长度信号。建议用户检查语料的长度分布（P90/P10 比）和模型的可分离性（MaxSim 标准差），若长度差异大或可分离性高，应改用 TokenANN 或 MUVERA。已使用 LEMUR 的团队可通过长度分层采样缓解偏差。

论文向量检索多向量压缩长度偏差 LEMUR Milvus

推荐理由：做向量检索的团队注意了——LEMUR 在长尾语料上会悄悄按文档长度排序而非相关性，LoTTE 上召回率从 98% 掉到 30.5%。如果你的语料长度差异大（P90/P10 > 20），建议先跑文中的两个检查再决定是否用 LEMUR。

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月6日

00:49

00:49

Qdrant@qdrant_engine

Qdrant 在 Vector Space Day 上联合 Adobe 展示了一种结合向量搜索与图治理层的企业级检索架构。该方案通过 Qdrant 实现快速向量检索，同时利用 Neo4j 的图数据库确保检索结果符合用户身份、权限和策略。现场演示显示，同一查询会根据不同用户的治理规则返回不同结果，而不仅仅是基于相关性排序。这一架构解决了企业 AI 中检索速度与安全合规之间的核心矛盾。

AI产品向量检索图数据库权限治理企业AI Qdrant

推荐理由：企业 AI 团队终于有了兼顾速度与权限的检索方案——Qdrant + Neo4j 的架构直接解决了「谁可以看什么」的治理难题，做企业级 RAG 或智能体系统的开发者值得关注。

5月26日

22:21

22:21

Qdrant@qdrant_engine

Qdrant 举办的 Vector Space Day 活动邀请到 Neo4j 开发者关系副总裁 Stephen Chin，他将分享上下文图如何赋予智能体关系理解能力，使其不仅能检索，还能真正推理。活动将于 6 月 11 日在旧金山 The Midway 举行，聚焦智能体与内存的生产级应用、从云到边缘的检索以及多模态 AI。已有 300 多位 AI 构建者报名参加。

行业智能体向量检索知识图谱 Neo4j Qdrant

推荐理由：做智能体或 RAG 系统的开发者，如果发现向量检索经常答非所问，这场演讲会点出关键缺失——关系理解。建议关注活动内容或后续回放。