全部 AI 动态 · AI 热点

6月18日

01:34

01:34

Milvus@milvusio

精选

Milvus在DocVQA上对比ColQwen（多向量）与Qwen3-VL-Embedding（稠密）的检索性能。精确搜索下，ColQwen3的nDCG@10为0.698，比稠密的0.521高17.7个百分点。近似搜索（LEMUR，ratio=5.0）中，ColQwen3得0.704，领先18.3点，且近似损失几乎为零。在MS MARCO等文本基准上，多向量优势被近似搜索抹平。多向量通过保留表格、图表等空间结构获得提升，适合发票、报告等视觉文档。

AI模型 ColQwen Qwen3-VL-Embedding Milvus 多模态检索视觉文档检索

推荐理由：Milvus用ColQwen和Qwen3-VL-Embedding做了对比，发现多向量在检索带图表的文档时比稠密向量强近18个点，近似搜索不掉分。处理PDF或扫描件可以关注这个结果。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月2日

10:21

10:21

Qdrant@qdrant_engine

Twelve Labs 的 James Le 将在 Vector Space Day 上展示如何正确构建多模态检索，从体育和音频的语义搜索到处理目标跟踪和高光生成的智能体工作流。视频是信息密度最高的模态，但大多数检索管道仍将其视为带图片的文本。该演讲将展示向量搜索的前沿方向，适合对多模态检索和智能体工作流感兴趣的开发者。

AI产品多模态检索向量搜索视频理解智能体 Twelve Labs

推荐理由：多模态检索是当前向量搜索的关键突破点，做视频理解、智能体或搜索系统的团队值得关注这场演讲，看看 Twelve Labs 如何将视频从“带图片的文本”变成真正的语义搜索对象。