全部 AI 动态 · AI 热点

6月26日

03:03

03:03

Weaviate@weaviate_io

精选76°

Weaviate 1.38 正式发布，带来 HFresh（GA）磁盘向量索引，支持十亿级动态数据、低内存与可预测延迟，无需定期重建。MCP Server（GA）可让 LLM、IDE 和 AI 代理直接连接 Weaviate，并支持运行时开关写入权限。异步复制重构为单调度器集群执行，默认开启。Boost API（预览）允许查询时轻量调整结果排序，嵌套对象过滤（预览）支持 "cars.make" 路径过滤。此外新增 replica 迁移、服务端用量护栏、text2vec-digitalocean 模块等功能。

AI产品 Weaviate 向量数据库 MCP/工具开源产品版本更新

推荐理由：Weaviate 发新版本啦，HFresh 索引和大模型连接插件 MCP Server 都转正了，十亿级数据不用重建，还能运行时开关 MCP 写入，运维省心很多。

6月25日

07:27

07:27

Weaviate@weaviate_io

精选

Engram 是 Weaviate 的记忆系统，能主动协调冲突信息。当用户从机器学习工程师晋升为 CEO，Engram 不会简单叠加两条记忆，而是先用 LLM 工具调用判断行动：重写旧记忆为“用户曾是工程师，现升为 CEO”，并删除新重复记忆。这样避免了记忆冗余，保持历史连贯，防止智能体上下文被矛盾事实污染。

AI产品 Engram Weaviate 记忆协调智能体上下文管理

推荐理由：Weaviate 的 Engram 解决了 AI 记忆的一大致命伤——信息冲突。不是简单存两笔，而是主动合成新版本，对做多角色 Agent 的朋友很实用。

6月18日

03:02

03:02

Weaviate@weaviate_io

Weaviate 宣布其云服务推出永久免费计划，无需试用期或信用卡。免费版包含 Weaviate 的向量数据库、查询代理和记忆能力。用户可用于个人项目、概念验证或初创公司。该计划旨在降低开发者使用向量数据库的门槛。

AI产品 Weaviate 向量数据库免费计划云服务

推荐理由：Weaviate 给了永久免费的向量数据库云服务，不绑信用卡，做原型或小项目直接上手，不用操心试用到期。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

01:32

01:32

Weaviate@weaviate_io

Weaviate 推出了包含 7 个可运行演示的新 playground，涵盖 AI 记忆、欺诈检测、电商搜索、聚类分析、向量搜索对比、护肤推荐和智能体决策树等场景。每个演示都提供可直接复制粘贴的提示词，方便开发者快速上手构建。其中 Engram 演示展示了 AI 智能体的持久记忆能力，能跨对话回忆事实和摘要；欺诈检测演示则通过查询智能体将自然语言问题转化为结构化查询，发现交易模式。Weaviate 还推出了免费永久层，鼓励开发者免费开始构建。

AI产品 Weaviate 向量数据库 RAG 智能体演示/Playground

推荐理由：做 AI 应用和智能体开发的团队，可以直接用这些演示模板快速验证想法，尤其是 Engram 的持久记忆和欺诈检测的查询智能体，值得立刻试试。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

03:15

03:15

Weaviate@weaviate_io

Weaviate 发布 Engram，一种结构化记忆系统，将记忆组织为分组、主题和作用域，而非简单累积。分组定义用例边界，主题指定提取的信息类型，作用域限定记忆归属（项目级、用户级、会话级）。这解决了传统记忆系统因无结构导致的跨用户污染、跨会话干扰和检索噪声问题。例如，编程助手可分离仓库级、用户级和会话级记忆，提升检索清晰度。Engram 通过异步管道处理原始输入，并利用 Weaviate 的多租户保持边界完整。

AI产品记忆系统结构化记忆 Weaviate Engram AI 应用

推荐理由：做 AI 应用尤其是编程助手或对话系统的团队，记忆混乱是常见痛点——Engram 的结构化方案直接解决了检索噪声和跨会话污染，值得点开看看怎么落地。

6月10日

06:13

06:13

Weaviate@weaviate_io

Weaviate 发布了名为 Engram 的托管记忆服务，旨在解决 AI 应用中因不良记忆系统导致的问题。Engram 不再简单地将聊天历史塞入上下文，而是通过异步管道提取关键事实、与已有知识协调、去重并保留更新，最终在数据库中维护干净的记忆状态。这使得 AI 代理能可靠地回忆用户偏好、学习先前任务、更新过时信息，而不会因上下文膨胀导致延迟、成本增加和混乱。对于需要长期记忆的 AI 应用开发者来说，Engram 提供了一种更严格、更高效的记忆基础设施。

AI产品记忆系统 Weaviate Engram 智能体基础设施

推荐理由：Weaviate 的 Engram 解决了 AI 应用中最头疼的记忆混乱问题——做智能体或对话系统的开发者，别再让模型背锅了，试试把记忆当基础设施来管。

6月4日

02:12

02:12

Weaviate@weaviate_io

Weaviate 宣布 Engram 正式 GA，这是一个专为智能体应用设计的托管记忆服务。传统记忆系统只是扩展上下文窗口，导致智能体随时间推移性能停滞、重复解决问题、浪费 token。Engram 通过异步管道主动维护记忆，支持去重、偏好变化和时间演化事实的处理。它提供“发后即忘”API、自然语言主题记忆磁铁、多级隔离和可组合管道，基于 Weaviate 的向量+关键词+元数据搜索。适用于聊天机器人、经验学习智能体和多智能体系统，前三个月免费至7月15日。

AI产品智能体记忆系统 Weaviate Engram 托管服务

推荐理由：做智能体应用的团队终于有了正经的记忆基础设施——Engram 解决了智能体随时间变笨的核心痛点，做聊天机器人、经验学习或多智能体系统的开发者值得立即试用。

5月29日

08:14

08:14

Weaviate@weaviate_io

Weaviate 发布了一篇简洁的 AI 智能体术语解释，涵盖 MCP、单/多智能体架构、技能、Agentic RAG 和记忆等核心概念。文章指出记忆是难点，并介绍了其自研的记忆与上下文管理方案 Engram。该内容旨在帮助开发者快速理解智能体相关术语，避免观看冗长的视频教程。

AI产品 MCP/工具智能体 RAG 记忆管理 Weaviate

推荐理由：想快速搞懂 AI 智能体核心概念（MCP、RAG、记忆）的开发者，不用再刷 45 分钟视频了，这篇直接给干货。

5月28日

10:04

10:04

Weaviate@weaviate_io

在柏林黑客松中，一个团队用 36 小时构建了结合 Twitter 趋势检测与个性化 AI 内容生成的系统。技术栈包括 Weaviate 用于语义搜索、Gemini 模型生成内容、Tavily 提供上下文检索，以及基于 Pioneer 的评分模型。系统通过语义聚类识别新兴趋势，并分析用户写作风格建立人格模型，从而生成符合个人风格的推文。该项目最终赢得 1 万美元大奖，展示了 AI 在社交媒体内容创作中的创新应用。

AI产品 Weaviate Gemini 趋势检测个性化内容生成黑客松

推荐理由：这个项目展示了如何用 Weaviate 和 Gemini 快速构建一个从趋势发现到个性化内容生成的完整 AI 工作流，做社交媒体运营或内容创作的团队可以直接借鉴其思路。

5月27日

00:47

00:47

Weaviate@weaviate_io

Booking.com 的 Başak Eskili 在 Weaviate Podcast 上分享了他们从关键词匹配到语义检索的 AI 进化之路，最终在 AWS 上使用 OpenSearch 并迁移到 Weaviate 以应对 1 亿+嵌入向量的生产级规模。他们构建的合作伙伴到客人的消息代理是真实的智能体 AI 案例：Weaviate 检索回复模板，API 获取上下文，智能体推荐或生成回复，必要时转人工。评估体系包括离线数据集、LLM 作为裁判、A/B 测试和实时反馈。他们还测试了过滤向量搜索、多线程并发、读写并发和成本优化，并展望了带记忆系统的个性化旅行代理。

AI产品向量搜索 Weaviate OpenSearch 智能体生产级部署

推荐理由：做向量搜索或 RAG 系统的团队，Booking.com 的 1 亿+嵌入生产实战比任何论文都实在，看完能避开不少坑。

5月22日

00:44

00:44

Weaviate@weaviate_io

一位开发者让 Claude Code 在仓库中实现一个简单功能，结果三回合就消耗了 80K tokens，因为代理难以定位代码中正确的逻辑部分。Weaviate v1.37.1 版本在数据库中内置了 MCP 服务器，支持 Claude Code、Cursor 或 VS Code 直接连接。该服务器允许代理将代码库等材料摄入 Weaviate，并在需要时进行混合搜索，精准处理混合意图的代码查询。MCP 服务器与 REST API 共用同一端口，无需额外进程或外部工具，大幅降低了上下文窗口浪费的问题。

AI产品 MCP/工具代码搜索 Weaviate Claude Code 混合搜索

推荐理由：Claude Code 用户常因上下文窗口爆炸而头疼，Weaviate 内置 MCP 服务器让代码搜索更精准，做 AI 编程的团队可以直接集成，省 token 又省心。

5月21日

00:26

00:26

Weaviate@weaviate_io

精选

Weaviate 1.37 版本新增了最大边际相关性（MMR）算法，用于解决向量搜索中返回高度相似重复结果的问题。通过一个参数 selection= Diversity.MMR(limit=5, balance=0.5)，算法在每次选择结果时惩罚与已选结果过于相似的候选，确保最终结果既相关又多样。balance 参数可调节多样性与相关性的权重，0.0 为最大多样性，1.0 为标准搜索。该功能适用于所有 near_* 查询，特别适合检索密集型智能体和标准 RAG 管道，能有效利用上下文窗口，避免浪费 slots。

AI产品向量搜索 MMR Weaviate RAG 检索多样性

推荐理由：做 RAG 或智能体检索的团队，终于不用被五个语义相同的 chunk 塞满上下文了——Weaviate 的 MMR 一行参数就能让结果既相关又多样，值得直接上手试。

5月19日

23:00

23:00

Weaviate@weaviate_io

精选

Weaviate推出新方法，使用Gemini embedding 2 multimodal直接对视频片段进行嵌入。无需转录文本或元数据，将原始视频分割成重叠片段后即可存入Weaviate。用户提问后系统直接从视频中定位相关片段并生成回答。该方法简化了视频搜索流程，消除了预处理步骤。相关notebook和完整指南已在GitHub和Weaviate博客发布。

技巧 Weaviate Gemini 多模态视频检索

推荐理由：视频搜索不用转文字了

5月16日

17:31

17:31

Weaviate@weaviate_io

精选

Weaviate 发布了名为 HFresh 的新型向量搜索索引，它通过将向量存储在磁盘上，仅在内存中保留紧凑的质心索引，大幅降低了内存需求。HFresh 将向量划分为多个小区域（postings），利用内存中的 HNSW 索引定位相关区域，再从磁盘获取数据，并采用两级旋转量化压缩。相比传统 HNSW 索引，HFresh 在十亿级向量规模下仍能保持可预测的延迟，尤其适合高维嵌入、成本敏感部署和写入密集型场景。目前 HFresh 已在 Weaviate Cloud 中提供，建议在非生产环境中测试。

AI产品向量搜索 HNSW HFresh Weaviate 内存优化

推荐理由：做向量搜索的团队终于不用为内存账单发愁了——HFresh 把 HNSW 的内存占用砍到零头，十亿级向量也能跑在更小的机器上，成本敏感或写入密集的场景尤其值得一试。

17:30

17:30

Weaviate@weaviate_io

Weaviate 在 Query Agent 中推出了 Suggest Queries Mode，能根据集合中的数据自动推荐查询问题，解决用户面对聊天机器人不知该问什么的痛点。相比手动添加静态模板或搭建复杂生成管道，这种方式更轻量且能提升用户参与度。该模式直接集成在现有 Query Agent 中，无需额外配置。对于构建知识库问答或数据探索类应用的团队，这是一个降低用户使用门槛的实用功能。

AI产品 Weaviate Query Agent 聊天机器人查询推荐数据探索

推荐理由：做知识库问答或数据探索应用的团队，终于不用再为「用户不知道问什么」头疼了——Weaviate 这个功能直接根据数据推荐问题，建议集成到你的 chatbot 里试试。