全部 AI 动态 · AI 热点

6月26日

01:51

01:51

Harrison Chase@hwchase17

精选73°

LangChain团队发布技术博客，详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库，其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引，并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引（inverted index）的经验。

技巧 SmithDB LangChain 智能体追踪全文搜索数据库

推荐理由：LangChain团队手把手教你如何为agent traces造一个数据库，对象存储上做全文搜索还能压到50-100ms延迟，干货满满。

01:26

01:26

LangChain@LangChainAI

LangChain 团队解决了在对象存储中构建全文搜索索引的挑战：每个 GET 请求耗时 50-100ms，且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案，涉及批量写入、压缩策略以减少请求次数，以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。

技巧 LangChain SmithDB 全文搜索对象存储倒排索引

推荐理由：LangChain 分享了怎么在对象存储上搞全文搜索，延迟 50-100ms 的情况下还能压出来倒排索引，挺实在的实战经验。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

06:43

06:43

Harrison Chase@hwchase17

LangChain 发布技术博客，揭秘其内部数据库 SmithDB 如何支持对数百 MB 的 Agent 追踪数据进行全文搜索和 JSON 过滤，同时保持中位数延迟仅 400ms。团队从零构建了自定义倒排索引，解决了大规模 Agent 日志的实时检索难题。该方案为 LLM 应用的可观测性和调试提供了高效基础设施。

AI产品 LangChain SmithDB 倒排索引 Agent追踪全文搜索

推荐理由：做 LLM 应用开发和 Agent 调试的团队，这篇博客展示了如何用自建索引解决大规模追踪数据的搜索性能瓶颈，值得参考其架构设计。

03:43

03:43

LangChain@LangChainAI

72°

LangChain 团队分享了他们为 SmithDB 构建自定义倒排索引的技术细节，以支持对高达数百 MB 的智能体追踪数据进行全文搜索和 JSON 过滤，同时将中位数延迟控制在 400 毫秒。他们从零开始设计索引结构，优化了存储和查询路径，解决了大规模追踪数据下的性能瓶颈。这一方案使得开发者能够高效地检索和分析复杂的智能体执行日志，对调试和优化 AI 应用至关重要。文章深入介绍了索引构建、压缩和查询优化的具体方法。

AI产品 LangChain SmithDB 全文搜索倒排索引智能体追踪

推荐理由：LangChain 解决了智能体追踪数据检索的痛点——百 MB 级日志也能秒级搜索，做 AI 应用调试和可观测性的团队值得学习这个自定义索引方案。