全部 AI 动态 · AI 热点

6月26日

01:51

01:51

Harrison Chase@hwchase17

精选73°

LangChain团队发布技术博客，详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库，其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引，并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引（inverted index）的经验。

技巧 SmithDB LangChain 智能体追踪全文搜索数据库

推荐理由：LangChain团队手把手教你如何为agent traces造一个数据库，对象存储上做全文搜索还能压到50-100ms延迟，干货满满。

01:26

01:26

LangChain@LangChainAI

LangChain 团队解决了在对象存储中构建全文搜索索引的挑战：每个 GET 请求耗时 50-100ms，且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案，涉及批量写入、压缩策略以减少请求次数，以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。

技巧 LangChain SmithDB 全文搜索对象存储倒排索引

推荐理由：LangChain 分享了怎么在对象存储上搞全文搜索，延迟 50-100ms 的情况下还能压出来倒排索引，挺实在的实战经验。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

06:43

06:43

Harrison Chase@hwchase17

LangChain 发布技术博客，揭秘其内部数据库 SmithDB 如何支持对数百 MB 的 Agent 追踪数据进行全文搜索和 JSON 过滤，同时保持中位数延迟仅 400ms。团队从零构建了自定义倒排索引，解决了大规模 Agent 日志的实时检索难题。该方案为 LLM 应用的可观测性和调试提供了高效基础设施。

AI产品 LangChain SmithDB 倒排索引 Agent追踪全文搜索

推荐理由：做 LLM 应用开发和 Agent 调试的团队，这篇博客展示了如何用自建索引解决大规模追踪数据的搜索性能瓶颈，值得参考其架构设计。

03:44

03:44

LangChain@LangChainAI

LangChain 宣布正在构建 SmithDB，旨在解决智能体可观测性带来的系统性问题。SmithDB 专注于处理智能体运行时的数据追踪、调试和监控需求，为开发者提供更可靠的底层基础设施。该项目目前处于早期阶段，LangChain 正在招聘相关工程师。对于构建复杂智能体系统的团队来说，SmithDB 有望填补智能体可观测性领域的空白。

AI产品智能体可观测性 LangChain SmithDB 基础设施

推荐理由：智能体可观测性是当前 AI 工程化的核心痛点，做智能体应用开发的团队值得关注——SmithDB 可能解决你调试和监控智能体行为的头疼问题。

03:43

03:43

LangChain@LangChainAI

72°

LangChain 团队分享了他们为 SmithDB 构建自定义倒排索引的技术细节，以支持对高达数百 MB 的智能体追踪数据进行全文搜索和 JSON 过滤，同时将中位数延迟控制在 400 毫秒。他们从零开始设计索引结构，优化了存储和查询路径，解决了大规模追踪数据下的性能瓶颈。这一方案使得开发者能够高效地检索和分析复杂的智能体执行日志，对调试和优化 AI 应用至关重要。文章深入介绍了索引构建、压缩和查询优化的具体方法。

AI产品 LangChain SmithDB 全文搜索倒排索引智能体追踪

推荐理由：LangChain 解决了智能体追踪数据检索的痛点——百 MB 级日志也能秒级搜索，做 AI 应用调试和可观测性的团队值得学习这个自定义索引方案。

5月19日

12:17

12:17

LangChain@LangChainAI

精选

LangChain 的 Ankush Gola 分享了构建 SmithDB 背后的技术细节，核心依赖两个开源项目：Apache DataFusion 和 Vortex。DataFusion 是一个基于 Rust 的可扩展查询引擎，团队为其定制了执行计划以适配工作负载和存储后端。Vortex 则是一个可扩展文件格式，支持为不同列自定义布局、编码和分块策略。这两个项目对于关注现代数据系统的开发者来说值得深入研究。

行业 LangChain SmithDB DataFusion Vortex 开源/仓库

推荐理由：做数据系统或 AI 基础设施的开发者，可以从 SmithDB 的架构思路中直接学到如何用 DataFusion 和 Vortex 搭建高性能查询引擎，值得点开看看具体实现。