全部 AI 动态 · AI 热点

6月26日

08:00

Qdrant@qdrant_engine

Qdrant联合Kaivid Labs创始工程师Tarun演示如何构建完全离线的RAG系统，使用Qdrant EDGE进行轻量级设备端向量搜索，搭配Google LiteRT通过硬件加速运行语言模型，实现文档问答、个人助理和笔记搜索，无需任何云依赖。活动时间为7月7日，包含现场实操。

技巧 Qdrant EDGE Google LiteRT RAG 本地推理向量搜索

推荐理由：教你用Qdrant EDGE和Google LiteRT搭一个完全离线的RAG系统，文档问答、个人助理全在本地跑，再也不用担心隐私和联网了。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

13:28

Milvus@milvusio

Milvus 和 Zilliz 生态系统推出 Zilliz Birdpedia，用鸟类比喻解释其组件：Milvus 是向量搜索引擎，可扫描千亿级高维向量；Cardinal 是 Zilliz Cloud 的高级向量搜索引擎，在 ANN 搜索、top-K、范围搜索和过滤密集型工作负载上表现优异；Woodpecker 是 Milvus 的云原生 WAL，无需 Kafka 或 Pulsar 即可实现连续写入和故障恢复；Loon 是 Milvus 3.0 和 Zilliz Vector Lakebase 的新存储引擎，支持数据湖中向量数据的版本化读取；Birdwatcher 是监控 Milvus 内部状态的工具。

AI产品 Milvus Zilliz Cardinal Woodpecker 向量搜索

推荐理由：用鸟比喻讲清 Milvus 各组件

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

22:28

Qdrant@qdrant_engine

Qdrant 发布了一项基准测试，比较了两种方法：直接将大量上下文发送给 LLM，以及使用 Qdrant 的两步检索管道仅获取最相关信息。结果显示，更大的上下文窗口会增加成本和延迟，而检索有助于减少 LLM 所需的上下文量，同时保持答案质量。随着上下文窗口的增长，检索不会消失，反而对效率、可扩展性和控制变得更加重要。

AI产品向量搜索 Qdrant 检索增强生成上下文窗口基准测试

推荐理由：做 RAG 或向量搜索的团队会关心这个关键权衡——大上下文窗口并非万能，检索仍是降本增效的核心手段，建议点开看具体数据。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

22:17

Qdrant@qdrant_engine

精选

该项目利用 Qdrant Edge 的向量搜索和边缘 RAG 技术，在不训练自定义机器学习模型的情况下实现火灾检测。系统将实时传感器读数与本地已知模式进行比对，实现快速、隐私优先的本地推理。这种方法避免了训练和维护专用模型的负担，适合资源受限的环境。项目展示了边缘计算与向量搜索在实时异常检测中的创新应用。

AI产品 Qdrant Edge 向量搜索边缘计算火灾检测 RAG

推荐理由：做物联网或边缘计算的开发者可以省去模型训练的麻烦——Qdrant Edge 的向量搜索直接匹配已知模式就能检测火灾，隐私和效率都兼顾，值得试试。

原文

6月9日

21:46

Qdrant@qdrant_engine

Vatsala Singh 开发了一个项目，利用 Qdrant 作为检索层，将个人照片集转化为自主 AI 智能体。该智能体能够理解自然语言请求、语义搜索记忆、检索相关照片和上下文，充当个人视觉记忆系统。这展示了向量搜索如何将静态数据转变为 AI 可以推理和交互的动态资源。项目代码和详细说明已在 ai.gopubby.com 上发布。

AI产品 Qdrant 向量搜索 AI 智能体照片管理个人记忆系统

推荐理由：做个人知识管理或视觉记忆系统的开发者，可以看看如何用向量搜索让照片库“活”起来——不再只是存储，而是能理解你的自然语言请求。

原文

00:14

Qdrant@qdrant_engine

精选

该项目利用 Qdrant Edge 构建了一个隐私优先的 SOS 检测系统，完全在本地运行，无需依赖云端。系统通过 YAMNet 进行音频嵌入，结合 Qdrant Edge 实现实时相似性搜索，并使用 SignozHQ 进行可观测性监控。这是一个将向量搜索应用于现实世界安全场景的创意实践，展示了 AI 在边缘设备上的潜力。

AI产品 Qdrant Edge 隐私优先 SOS 检测向量搜索边缘 AI

推荐理由：对于关注隐私和边缘 AI 的开发者，这个项目展示了如何用向量搜索在本地实现实时安全检测，值得动手试试。

原文

6月7日

07:57

Gary Marcus@GaryMarcus

Gary Marcus 转发了一则关于 TurboVec 的消息，该工具声称能将 AI 模型的内存占用从 31GB 压缩至 4GB，实现 16 倍的内存降低。TurboVec 在向量搜索速度上超越 FAISS，完全离线运行，兼容 LangChain 和 LlamaIndex，且完全开源。如果属实，这将大幅降低 AI 部署的硬件门槛，无需昂贵 GPU 集群和云依赖。Marcus 认为这类技术迟早会冲击现有数据基础设施投资。

AI产品 TurboVec 向量搜索开源/仓库内存优化 FAISS

推荐理由：做向量搜索或部署 AI 应用的团队，如果被内存和 GPU 成本卡住，TurboVec 的开源方案值得一试——16 倍内存压缩可能改变你的架构选择。

原文

07:20

Gary Marcus@GaryMarcus

Google 推出的 TurboVec 工具将 AI 向量搜索的内存占用从 31GB 降至 4GB，实现 16 倍压缩，同时搜索速度超越 FAISS。该工具完全开源，支持 LangChain 和 LlamaIndex，可在普通 Mac 上离线运行，无需昂贵 GPU 集群或云依赖。这一突破大幅降低了 AI 系统的部署成本，可能颠覆现有数据基础设施投资。

AI产品 TurboVec 向量搜索开源/仓库内存优化 LangChain

推荐理由：做向量搜索或 AI 应用部署的开发者，内存和成本一直是痛点——TurboVec 直接砍掉 16 倍内存，还开源可离线跑，值得立刻试。

原文

6月3日

00:52

Qdrant@qdrant_engine

Qdrant 宣布将举办 Vector Space Day 大会，聚焦 AI 记忆与检索技术。Cognee 的 Dave Nielsen 将剖析当前系统中短期与长期记忆的真实实现，指出 AI 记忆并非单一技术，而是 Markdown 文件、向量数据库和图数据库的混合体。大会还涵盖从云端到边缘的检索、多模态 AI 等话题，面向构建向量搜索、AI 记忆、上下文工程和检索基础设施的工程师。活动将于 6 月 11 日举行，现已开放售票。

行业 AI记忆向量搜索检索基础设施上下文工程 Qdrant

推荐理由：搞 AI 记忆和检索的工程师终于有个正经的技术大会了——Dave Nielsen 会拆解短期/长期记忆的真实架构，做 RAG 或智能体的团队值得去听听。

原文

6月2日

10:21

Qdrant@qdrant_engine

Twelve Labs 的 James Le 将在 Vector Space Day 上展示如何正确构建多模态检索，从体育和音频的语义搜索到处理目标跟踪和高光生成的智能体工作流。视频是信息密度最高的模态，但大多数检索管道仍将其视为带图片的文本。该演讲将展示向量搜索的前沿方向，适合对多模态检索和智能体工作流感兴趣的开发者。

AI产品多模态检索向量搜索视频理解智能体 Twelve Labs

推荐理由：多模态检索是当前向量搜索的关键突破点，做视频理解、智能体或搜索系统的团队值得关注这场演讲，看看 Twelve Labs 如何将视频从“带图片的文本”变成真正的语义搜索对象。

原文

6月1日

23:00

Milvus@milvusio

精选

向量搜索擅长语义匹配，但搜索精确型号如“XR-2048”可能出错。BM25能精确匹配术语，但会漏掉语义相近的“refund policy”和“return process”。Milvus通过RRF（Reciprocal Rank Fusion）融合向量搜索和BM25结果。配置只需三步：添加稠密和稀疏向量字段、启用内建BM25函数、使用RRFRanker。内建BM25时不要手动插入稀疏向量，外部模型如BGE-M3才需手动提供。

技巧 Milvus BM25 混合搜索向量搜索 RRF

推荐理由：Milvus官方教混合搜索

原文

5月30日

11:21

Qdrant@qdrant_engine

Qdrant 宣布 Arize AI 的 DevRel 负责人 Laurie Voss 将在 6 月 11 日的 Vector Space Day 上演讲，主题是向量搜索评估。他强调，仅调整块大小并运行几个演示查询不是有效的评估策略。Voss 将介绍关键的检索指标、能应对现实场景的黄金数据集，以及如何将评估集成到 CI 中，以便在客户发现问题之前发现回归。活动面向构建向量搜索、AI 记忆、上下文工程或检索基础设施的开发者。

AI产品向量搜索评估策略检索指标 CI集成 Qdrant

推荐理由：做向量搜索或 RAG 的团队终于有了正经的评估方法论——Laurie Voss 会教你用指标和 CI 替代“感觉还行”，建议做检索基础设施的开发者点开看看。

原文

11:19

Patrick Loeber@patloeber

Qdrant 在柏林举办多模态搜索工作坊，参与者可以动手实验 Gemini Embedding 2 和 Qdrant 的集成。活动聚焦 AI 检索、智能体和现代搜索系统，探讨在智能体时代检索的演进、生产级 RAG、记忆系统和向量搜索。同一天还将举办 Vector Space Meetup，主题为“智能体时代的检索”，提供交流与网络机会。适合对向量搜索、RAG 和 AI 智能体感兴趣的开发者参加。

AI产品向量搜索 RAG 智能体 Gemini Embedding 2 Qdrant

推荐理由：做向量搜索和 RAG 的开发者可以直接在柏林现场动手试 Gemini Embedding 2 和 Qdrant 的集成，还能和同行交流智能体时代的检索趋势，值得关注。

原文

5月29日

21:36

Qdrant@qdrant_engine

Qdrant在柏林举办两场AI活动，主题围绕AI检索、智能体、现代搜索系统。活动包括讨论检索在智能体时代的演变、生产级RAG、记忆系统和向量搜索。同一天还举办Vector Space Meetup，主题为“智能体时代的检索”。活动面向AI生态系统的开发者、研究者，提供交流与网络机会。

行业 AI检索智能体向量搜索 RAG Qdrant

推荐理由：对AI检索、智能体或向量搜索感兴趣的柏林开发者，可以现场交流前沿实践，值得参加。

原文

5月28日

18:10

marktechpost@Sana Hassan

本教程在 Google Colab 中搭建完整的 pgvector 环境，演示如何将 PostgreSQL 用作强大的向量数据库。内容包括安装 PostgreSQL、编译 pgvector 扩展、通过 Psycopg 连接并注册向量类型以实现 Python 集成，以及使用 SentenceTransformers 生成嵌入并存储。教程覆盖了语义搜索、混合搜索、稀疏向量和量化向量四种搜索模式，为 AI 应用提供实用的向量搜索实现方案。

技巧 pgvector 向量搜索 PostgreSQL 教程嵌入

推荐理由：想用 PostgreSQL 做向量搜索的开发者可以直接跟着教程在 Colab 里跑通，省去环境配置的坑，四种搜索模式覆盖了从基础到高级的需求。

原文

5月27日

11:21

Qdrant@qdrant_engine

Qdrant 宣布与 Aman 达成独家合作，为以色列企业提供高性能向量搜索基础设施。Aman 拥有 25 年以上数据基础设施现代化经验，将帮助银行、保险、制造、游戏等行业团队解决现有搜索架构无法满足 AI 工作负载的问题。Qdrant 是用 Rust 编写的可组合向量搜索引擎，支持云、本地、混合和边缘部署，在十亿级规模下提供可预测的低尾延迟。此次合作旨在加速以色列企业从“此路不通”到生产级 AI 的进程。

行业向量搜索 Qdrant Aman 以色列企业AI

推荐理由：以色列企业团队终于有了针对 AI 工作负载优化的向量搜索方案，做 RAG 或智能体应用的开发者可以直接联系 Aman 评估。

原文

00:47

Weaviate@weaviate_io

Booking.com 的 Başak Eskili 在 Weaviate Podcast 上分享了他们从关键词匹配到语义检索的 AI 进化之路，最终在 AWS 上使用 OpenSearch 并迁移到 Weaviate 以应对 1 亿+嵌入向量的生产级规模。他们构建的合作伙伴到客人的消息代理是真实的智能体 AI 案例：Weaviate 检索回复模板，API 获取上下文，智能体推荐或生成回复，必要时转人工。评估体系包括离线数据集、LLM 作为裁判、A/B 测试和实时反馈。他们还测试了过滤向量搜索、多线程并发、读写并发和成本优化，并展望了带记忆系统的个性化旅行代理。

AI产品向量搜索 Weaviate OpenSearch 智能体生产级部署

推荐理由：做向量搜索或 RAG 系统的团队，Booking.com 的 1 亿+嵌入生产实战比任何论文都实在，看完能避开不少坑。

原文

5月26日

21:31

Ate-a-Pi@svpino

Oracle 在 AI 领域发力，其 26ai 版本实现了多项突破性功能。用户可以直接在数据库中运行大语言模型和嵌入模型，无需将数据发送到外部。数据库支持混合向量搜索（语义+关键词），并引入 JSON 关系二元性视图，兼顾关系模型的稳定性和 JSON 的灵活性。内置代码生成工具可辅助编写 SQL。这些特性让 Oracle 从传统企业级数据库转型为 AI 原生平台。

AI产品 Oracle AI 数据库向量搜索 JSON 关系二元性代码生成

推荐理由：数据库内直接运行 LLM 和嵌入模型，解决了数据隐私和传输延迟痛点，做企业级 AI 应用的开发者可以直接在 Oracle 中实现智能搜索和生成，省去额外架构。

原文

5月22日

08:05

Milvus@milvusio

精选

Zilliz 开发者关系主管在伦敦 Unstructured Data Meetup 上分享了两种在 Zilliz Cloud 中保持过滤向量搜索快速且准确的方法。第一种方法是在过滤时保留图连接性，允许搜索临时遍历被过滤的节点作为中间跳转，避免 HNSW 图形成孤立“岛屿”导致召回率下降。第二种方法针对高选择性过滤器，当过滤后数据子集很小时，先过滤再暴力扫描可能比索引搜索更快。这些技术解决了大规模向量搜索中过滤与速度的平衡问题。

AI产品向量搜索过滤 Zilliz Cloud HNSW 性能优化

推荐理由：做向量搜索或 RAG 系统的开发者，这个方案直接解决了过滤后召回率下降的痛点，值得看看 Zilliz 的工程实践。

原文

08:05

Qdrant@qdrant_engine

Qdrant 宣布将于6月11日在 The Midway 举办 Vector Space Day 活动，并公布了部分演讲嘉宾及主题。演讲涵盖持续学习与记忆、Agent 技能文件限制、大规模扩展、上下文图、文档处理以及视频智能体等方向。活动为全天单轨技术内容，聚焦搜索与 AI 检索、智能体与记忆、边缘与机器人 AI。开发者可通过 luma.com/vsd-sf 购票参与。

行业向量搜索智能体记忆系统上下文图视频智能体

推荐理由：这场活动汇聚了 Mem0、Google DeepMind、Neo4j、LlamaIndex 等一线团队，覆盖 Agent 记忆、上下文图、视频智能体等前沿话题，做搜索和 AI 检索的开发者值得关注。

原文

5月21日

08:00

Qdrant@qdrant_engine

Qdrant 宣布将于6月11日在旧金山 The Midway 举办 Vector Space Day 技术大会。会议邀请了来自 AWS、Google DeepMind、Adobe、Qualcomm 等公司的技术专家，围绕向量搜索、AI 记忆、上下文工程和检索基础设施等主题进行演讲。大会将深入探讨生产环境中的智能体与记忆、从云到边缘的检索以及多模态 AI。早鸟票正在发售，即将截止，适合 AI 构建者和开发者参加。

行业向量搜索 AI记忆智能体检索基础设施多模态AI

推荐理由：向量搜索和 AI 记忆是构建生产级智能体的关键基础设施，做 RAG 或智能体应用的团队值得关注这场大会，早鸟票快截止了，建议尽早决定。

原文

08:00

Milvus@milvusio

精选

Milvus 在 2.6.2 版本中推出了 Boost Ranker 功能，解决了电商和企业团队在使用向量搜索时遇到的痛点：语义匹配结果往往不符合业务需求（如优先展示有库存的商品）。传统做法是在向量数据库外构建第二套系统进行后处理，增加了维护成本。Boost Ranker 将业务规则直接集成到搜索过程中，通过 filter、weight 和 re-sort 三步操作，在一个搜索调用内完成排序，无需外部依赖、无需重建索引、无需维护第二套系统，且几乎没有延迟开销。

AI产品 Milvus 向量搜索 Boost Ranker 业务规则电商搜索

推荐理由：做电商搜索或企业级向量搜索的团队，终于不用在数据库外再搭一套规则引擎了——Boost Ranker 把业务逻辑直接塞进搜索里，省掉一个系统，建议直接试试。

原文

00:26

Weaviate@weaviate_io

精选

Weaviate 1.37 版本新增了最大边际相关性（MMR）算法，用于解决向量搜索中返回高度相似重复结果的问题。通过一个参数 selection= Diversity.MMR(limit=5, balance=0.5)，算法在每次选择结果时惩罚与已选结果过于相似的候选，确保最终结果既相关又多样。balance 参数可调节多样性与相关性的权重，0.0 为最大多样性，1.0 为标准搜索。该功能适用于所有 near_* 查询，特别适合检索密集型智能体和标准 RAG 管道，能有效利用上下文窗口，避免浪费 slots。

AI产品向量搜索 MMR Weaviate RAG 检索多样性

推荐理由：做 RAG 或智能体检索的团队，终于不用被五个语义相同的 chunk 塞满上下文了——Weaviate 的 MMR 一行参数就能让结果既相关又多样，值得直接上手试。

原文

5月19日

17:01

Qdrant@qdrant_engine

Qdrant 官方指出，真正的检索系统需要结合语义搜索、元数据过滤、结构化约束和快速查询执行。他们发布了一篇深度文章，详细讲解如何在生产环境中使用 Qdrant 的深度查询过滤功能。这打破了“向量搜索=嵌入”的简单认知，强调了多维度过滤对检索质量的重要性。对于构建 RAG 系统的开发者来说，这是提升准确性和效率的关键实践。

AI产品 Qdrant 向量搜索 RAG 元数据过滤检索系统

推荐理由：做 RAG 或搜索系统的团队，别再只靠嵌入向量了——Qdrant 这篇实战指南教你用元数据过滤和结构化约束提升检索精度，值得直接参考。

原文

12:41

Milvus@milvusio

Zilliz 开发者关系负责人 Jiang Chen 在伦敦非结构化数据 Meetup 上，分享了如何在不牺牲搜索质量的前提下降低向量数据库的 serving 成本。他指出，向量搜索昂贵的主因是索引占用大量 RAM 和 NVMe SSD。RaBitQ 算法通过将 float32 向量压缩到每维度 1 bit，并在量化前加入随机旋转来保留更多信息，从而大幅降低内存和存储开销，同时保持低质量损失。该方法适合需要控制基础设施成本的向量搜索场景。

AI产品向量搜索 RaBitQ Zilliz 成本优化索引压缩

推荐理由：向量搜索成本是很多团队的痛点，RaBitQ 用 1-bit 压缩加随机旋转做到了低成本低损耗，做向量数据库选型或优化成本的开发者值得看看这个方案。

原文

5月16日

17:31

Weaviate@weaviate_io

精选

Weaviate 发布了名为 HFresh 的新型向量搜索索引，它通过将向量存储在磁盘上，仅在内存中保留紧凑的质心索引，大幅降低了内存需求。HFresh 将向量划分为多个小区域（postings），利用内存中的 HNSW 索引定位相关区域，再从磁盘获取数据，并采用两级旋转量化压缩。相比传统 HNSW 索引，HFresh 在十亿级向量规模下仍能保持可预测的延迟，尤其适合高维嵌入、成本敏感部署和写入密集型场景。目前 HFresh 已在 Weaviate Cloud 中提供，建议在非生产环境中测试。

AI产品向量搜索 HNSW HFresh Weaviate 内存优化

推荐理由：做向量搜索的团队终于不用为内存账单发愁了——HFresh 把 HNSW 的内存占用砍到零头，十亿级向量也能跑在更小的机器上，成本敏感或写入密集的场景尤其值得一试。

原文