03:03Weaviate@weaviate_io精选76°Weaviate 1.38 正式发布,带来 HFresh(GA)磁盘向量索引,支持十亿级动态数据、低内存与可预测延迟,无需定期重建。MCP Server(GA)可让 LLM、IDE 和 AI 代理直接连接 Weaviate,并支持运行时开关写入权限。异步复制重构为单调度器集群执行,默认开启。Boost API(预览)允许查询时轻量调整结果排序,嵌套对象过滤(预览)支持 "cars.make" 路径过滤。此外新增 replica 迁移、服务端用量护栏、text2vec-digitalocean 模块等功能。AI产品Weaviate向量数据库MCP/工具开源产品版本更新推荐理由:Weaviate 发新版本啦,HFresh 索引和大模型连接插件 MCP Server 都转正了,十亿级数据不用重建,还能运行时开关 MCP 写入,运维省心很多。原文
07:27Weaviate@weaviate_io精选Engram 是 Weaviate 的记忆系统,能主动协调冲突信息。当用户从机器学习工程师晋升为 CEO,Engram 不会简单叠加两条记忆,而是先用 LLM 工具调用判断行动:重写旧记忆为“用户曾是工程师,现升为 CEO”,并删除新重复记忆。这样避免了记忆冗余,保持历史连贯,防止智能体上下文被矛盾事实污染。AI产品EngramWeaviate记忆协调智能体上下文管理推荐理由:Weaviate 的 Engram 解决了 AI 记忆的一大致命伤——信息冲突。不是简单存两笔,而是主动合成新版本,对做多角色 Agent 的朋友很实用。原文
03:02Weaviate@weaviate_ioWeaviate 宣布其云服务推出永久免费计划,无需试用期或信用卡。免费版包含 Weaviate 的向量数据库、查询代理和记忆能力。用户可用于个人项目、概念验证或初创公司。该计划旨在降低开发者使用向量数据库的门槛。AI产品Weaviate向量数据库免费计划云服务推荐理由:Weaviate 给了永久免费的向量数据库云服务,不绑信用卡,做原型或小项目直接上手,不用操心试用到期。原文
01:32Weaviate@weaviate_ioWeaviate 推出了包含 7 个可运行演示的新 playground,涵盖 AI 记忆、欺诈检测、电商搜索、聚类分析、向量搜索对比、护肤推荐和智能体决策树等场景。每个演示都提供可直接复制粘贴的提示词,方便开发者快速上手构建。其中 Engram 演示展示了 AI 智能体的持久记忆能力,能跨对话回忆事实和摘要;欺诈检测演示则通过查询智能体将自然语言问题转化为结构化查询,发现交易模式。Weaviate 还推出了免费永久层,鼓励开发者免费开始构建。AI产品Weaviate向量数据库RAG智能体演示/Playground推荐理由:做 AI 应用和智能体开发的团队,可以直接用这些演示模板快速验证想法,尤其是 Engram 的持久记忆和欺诈检测的查询智能体,值得立刻试试。原文
03:15Weaviate@weaviate_ioWeaviate 发布 Engram,一种结构化记忆系统,将记忆组织为分组、主题和作用域,而非简单累积。分组定义用例边界,主题指定提取的信息类型,作用域限定记忆归属(项目级、用户级、会话级)。这解决了传统记忆系统因无结构导致的跨用户污染、跨会话干扰和检索噪声问题。例如,编程助手可分离仓库级、用户级和会话级记忆,提升检索清晰度。Engram 通过异步管道处理原始输入,并利用 Weaviate 的多租户保持边界完整。AI产品记忆系统结构化记忆WeaviateEngramAI 应用推荐理由:做 AI 应用尤其是编程助手或对话系统的团队,记忆混乱是常见痛点——Engram 的结构化方案直接解决了检索噪声和跨会话污染,值得点开看看怎么落地。原文
06:13Weaviate@weaviate_ioWeaviate 发布了名为 Engram 的托管记忆服务,旨在解决 AI 应用中因不良记忆系统导致的问题。Engram 不再简单地将聊天历史塞入上下文,而是通过异步管道提取关键事实、与已有知识协调、去重并保留更新,最终在数据库中维护干净的记忆状态。这使得 AI 代理能可靠地回忆用户偏好、学习先前任务、更新过时信息,而不会因上下文膨胀导致延迟、成本增加和混乱。对于需要长期记忆的 AI 应用开发者来说,Engram 提供了一种更严格、更高效的记忆基础设施。AI产品记忆系统WeaviateEngram智能体基础设施推荐理由:Weaviate 的 Engram 解决了 AI 应用中最头疼的记忆混乱问题——做智能体或对话系统的开发者,别再让模型背锅了,试试把记忆当基础设施来管。原文
02:12Weaviate@weaviate_ioWeaviate 宣布 Engram 正式 GA,这是一个专为智能体应用设计的托管记忆服务。传统记忆系统只是扩展上下文窗口,导致智能体随时间推移性能停滞、重复解决问题、浪费 token。Engram 通过异步管道主动维护记忆,支持去重、偏好变化和时间演化事实的处理。它提供“发后即忘”API、自然语言主题记忆磁铁、多级隔离和可组合管道,基于 Weaviate 的向量+关键词+元数据搜索。适用于聊天机器人、经验学习智能体和多智能体系统,前三个月免费至7月15日。AI产品智能体记忆系统WeaviateEngram托管服务推荐理由:做智能体应用的团队终于有了正经的记忆基础设施——Engram 解决了智能体随时间变笨的核心痛点,做聊天机器人、经验学习或多智能体系统的开发者值得立即试用。原文
08:14Weaviate@weaviate_ioWeaviate 发布了一篇简洁的 AI 智能体术语解释,涵盖 MCP、单/多智能体架构、技能、Agentic RAG 和记忆等核心概念。文章指出记忆是难点,并介绍了其自研的记忆与上下文管理方案 Engram。该内容旨在帮助开发者快速理解智能体相关术语,避免观看冗长的视频教程。AI产品MCP/工具智能体RAG记忆管理Weaviate推荐理由:想快速搞懂 AI 智能体核心概念(MCP、RAG、记忆)的开发者,不用再刷 45 分钟视频了,这篇直接给干货。原文
10:04Weaviate@weaviate_io在柏林黑客松中,一个团队用 36 小时构建了结合 Twitter 趋势检测与个性化 AI 内容生成的系统。技术栈包括 Weaviate 用于语义搜索、Gemini 模型生成内容、Tavily 提供上下文检索,以及基于 Pioneer 的评分模型。系统通过语义聚类识别新兴趋势,并分析用户写作风格建立人格模型,从而生成符合个人风格的推文。该项目最终赢得 1 万美元大奖,展示了 AI 在社交媒体内容创作中的创新应用。AI产品WeaviateGemini趋势检测个性化内容生成黑客松推荐理由:这个项目展示了如何用 Weaviate 和 Gemini 快速构建一个从趋势发现到个性化内容生成的完整 AI 工作流,做社交媒体运营或内容创作的团队可以直接借鉴其思路。原文
00:47Weaviate@weaviate_ioBooking.com 的 Başak Eskili 在 Weaviate Podcast 上分享了他们从关键词匹配到语义检索的 AI 进化之路,最终在 AWS 上使用 OpenSearch 并迁移到 Weaviate 以应对 1 亿+嵌入向量的生产级规模。他们构建的合作伙伴到客人的消息代理是真实的智能体 AI 案例:Weaviate 检索回复模板,API 获取上下文,智能体推荐或生成回复,必要时转人工。评估体系包括离线数据集、LLM 作为裁判、A/B 测试和实时反馈。他们还测试了过滤向量搜索、多线程并发、读写并发和成本优化,并展望了带记忆系统的个性化旅行代理。AI产品向量搜索WeaviateOpenSearch智能体生产级部署推荐理由:做向量搜索或 RAG 系统的团队,Booking.com 的 1 亿+嵌入生产实战比任何论文都实在,看完能避开不少坑。原文
00:44Weaviate@weaviate_io一位开发者让 Claude Code 在仓库中实现一个简单功能,结果三回合就消耗了 80K tokens,因为代理难以定位代码中正确的逻辑部分。Weaviate v1.37.1 版本在数据库中内置了 MCP 服务器,支持 Claude Code、Cursor 或 VS Code 直接连接。该服务器允许代理将代码库等材料摄入 Weaviate,并在需要时进行混合搜索,精准处理混合意图的代码查询。MCP 服务器与 REST API 共用同一端口,无需额外进程或外部工具,大幅降低了上下文窗口浪费的问题。AI产品MCP/工具代码搜索WeaviateClaude Code混合搜索10 个信源在谈推荐理由:Claude Code 用户常因上下文窗口爆炸而头疼,Weaviate 内置 MCP 服务器让代码搜索更精准,做 AI 编程的团队可以直接集成,省 token 又省心。原文
00:26Weaviate@weaviate_io精选Weaviate 1.37 版本新增了最大边际相关性(MMR)算法,用于解决向量搜索中返回高度相似重复结果的问题。通过一个参数 selection= Diversity.MMR(limit=5, balance=0.5),算法在每次选择结果时惩罚与已选结果过于相似的候选,确保最终结果既相关又多样。balance 参数可调节多样性与相关性的权重,0.0 为最大多样性,1.0 为标准搜索。该功能适用于所有 near_* 查询,特别适合检索密集型智能体和标准 RAG 管道,能有效利用上下文窗口,避免浪费 slots。AI产品向量搜索MMRWeaviateRAG检索多样性推荐理由:做 RAG 或智能体检索的团队,终于不用被五个语义相同的 chunk 塞满上下文了——Weaviate 的 MMR 一行参数就能让结果既相关又多样,值得直接上手试。原文
23:00Weaviate@weaviate_io精选Weaviate推出新方法,使用Gemini embedding 2 multimodal直接对视频片段进行嵌入。无需转录文本或元数据,将原始视频分割成重叠片段后即可存入Weaviate。用户提问后系统直接从视频中定位相关片段并生成回答。该方法简化了视频搜索流程,消除了预处理步骤。相关notebook和完整指南已在GitHub和Weaviate博客发布。技巧WeaviateGemini多模态视频检索推荐理由:视频搜索不用转文字了原文
17:31Weaviate@weaviate_io精选Weaviate 发布了名为 HFresh 的新型向量搜索索引,它通过将向量存储在磁盘上,仅在内存中保留紧凑的质心索引,大幅降低了内存需求。HFresh 将向量划分为多个小区域(postings),利用内存中的 HNSW 索引定位相关区域,再从磁盘获取数据,并采用两级旋转量化压缩。相比传统 HNSW 索引,HFresh 在十亿级向量规模下仍能保持可预测的延迟,尤其适合高维嵌入、成本敏感部署和写入密集型场景。目前 HFresh 已在 Weaviate Cloud 中提供,建议在非生产环境中测试。AI产品向量搜索HNSWHFreshWeaviate内存优化推荐理由:做向量搜索的团队终于不用为内存账单发愁了——HFresh 把 HNSW 的内存占用砍到零头,十亿级向量也能跑在更小的机器上,成本敏感或写入密集的场景尤其值得一试。原文
17:30Weaviate@weaviate_ioWeaviate 在 Query Agent 中推出了 Suggest Queries Mode,能根据集合中的数据自动推荐查询问题,解决用户面对聊天机器人不知该问什么的痛点。相比手动添加静态模板或搭建复杂生成管道,这种方式更轻量且能提升用户参与度。该模式直接集成在现有 Query Agent 中,无需额外配置。对于构建知识库问答或数据探索类应用的团队,这是一个降低用户使用门槛的实用功能。AI产品WeaviateQuery Agent聊天机器人查询推荐数据探索推荐理由:做知识库问答或数据探索应用的团队,终于不用再为「用户不知道问什么」头疼了——Weaviate 这个功能直接根据数据推荐问题,建议集成到你的 chatbot 里试试。原文