全部 AI 动态 · AI 热点

6月30日

01:33

AWS Machine Learning Blog@Joshua Lacy

精选

本文介绍如何使用Amazon Bedrock AgentCore的内置可观测性功能调试生产环境中的智能体故障。文章涵盖常见的故障模式，如无限循环和工具调用失败。通过追踪和指标分析智能体行为，并提供结构化工作流来解决问题。本文是两部分系列的第一部分，第二部分将讨论性能优化和内存管理。

技巧 Amazon Bedrock AgentCore 可观测性智能体工具调用

推荐理由：AWS博客教你用Bedrock AgentCore内置观察功能排查生产智能体故障，比如无限循环和工具调用失败，省去自己搭建监控的麻烦。

原文

6月27日

11:51

Guillermo Rauch@rauchg

精选

Agent调试困难，因为AI模型行为非确定，且Agent是复杂分布式系统，涉及多个步骤、函数、沙箱及数十个API服务。Vercel团队为eve.dev内置可观测性，支持检查模型调用、工具调用、运行时错误及token用量，已获用户好评。

AI产品 Vercel eve 智能体可观测性调试

推荐理由：Vercel给eve.dev加了agent调试跟踪，能看模型调用、错误和token，开发者福音。

原文

6月24日

02:24

elvis@omarsar0

Latitude是一个开源（MIT许可）的Agent可观测性工具。将Latitude指向Claude Code设置后，可实时查看token预算消耗情况。它能展示Agent的完整行为，捕获重复失败的任务，并显示频率和原因。用户无需离开编辑器即可直接修复这些问题。

AI产品 Latitude Claude Code 智能体可观测性

推荐理由：Claude Code吃token太猛？Latitude实时监控还能捉住重复失败的bug，免费开源，省心省钱！

原文

6月20日

04:25

AI Engineer@aiDotEngineer

AI Engineer World's Fair 将于2025年6月29日至7月2日在旧金山Moscone West举办。60多家金牌赞助商已确认参展，覆盖基础设施、推理、智能体、数据、评估和可观测性等六大领域。活动旨在展示完整的AI工程生态栈，从底层基础到上层应用。

行业 AI Engineer Moscone West 智能体基础设施可观测性

推荐理由：AI工程师的年度盛会，60多个顶级赞助商齐聚一堂，覆盖从底层硬件到上层Agent的完整栈，值得去现场看看趋势。

原文

6月17日

03:43

LangChain@LangChainAI

LangSmith 新增代理拆解功能，可让开发者追踪 AI 代理在生产环境中的每一步决策。该功能帮助快速定位失败原因，并识别关键改进点。无需修改代码即可解析代理行为逻辑，实现持续优化。

AI产品 LangSmith LangChain 智能体可观测性生产环境

推荐理由：LangSmith 新功能让你像拆玩具一样拆解 AI 代理，哪步走错了门清，生产环境调试超省心。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

14:11

Harrison Chase@hwchase17

精选

开发者 Saurabh 强调，Agent 必须有可观测性。他用 LangGraph 做编排，LangSmith 做追踪、评估和回归测试。如果无法解释 Agent 为何给出某个回答，那就只是 demo 而非架构。他建议通过 tracing 捕获 prompt 和工具调用的全部上下文。

技巧 LangGraph LangSmith Agent 可观测性智能体

推荐理由：如果你在用 LangGraph 做 agent，这招能帮你从 demo 变成可交付的系统——关键是 LangSmith 的 trace 和 eval。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

04:40

LangChain@LangChainAI

LangChain 推出 LangSmith Observability 功能，旨在帮助开发者实时监控和理解智能体（agent）的运行表现。该工具能够快速定位问题根源，提升调试效率。对于使用 LangChain 构建复杂智能体应用的团队来说，这解决了追踪和诊断性能瓶颈的痛点。目前该功能已可用，相关推文获得初步关注。

AI产品智能体可观测性 LangChain 调试工具实时监控

推荐理由：做智能体应用的开发者终于不用靠猜来排查问题了——LangSmith Observability 让实时性能追踪变得直观，建议用 LangChain 的团队直接试试。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

05:33

LangChain@LangChainAI

LangChain 发布了 LLM Gateway，将可观测性与执行控制功能整合到 LangSmith 平台中。此前，开发者需要分别使用独立的网关、护栏平台和可观测性堆栈，并在出现问题时手动关联三者的信号。LLM Gateway 解决了这一痛点，提供了统一的入口来监控和强制执行 LLM 调用策略。对于使用 LangSmith 的团队，这意味着更简单的架构和更快的故障排查。

AI产品 LangChain LLM Gateway 可观测性执行控制 LangSmith

推荐理由：做 LLM 应用开发的团队终于不用在网关、护栏和可观测性之间来回切换了——LangSmith 用户可以直接在平台内完成监控和策略执行，建议点开看看具体怎么整合。

原文

03:44

LangChain@LangChainAI

LangChain 宣布正在构建 SmithDB，旨在解决智能体可观测性带来的系统性问题。SmithDB 专注于处理智能体运行时的数据追踪、调试和监控需求，为开发者提供更可靠的底层基础设施。该项目目前处于早期阶段，LangChain 正在招聘相关工程师。对于构建复杂智能体系统的团队来说，SmithDB 有望填补智能体可观测性领域的空白。

AI产品智能体可观测性 LangChain SmithDB 基础设施

推荐理由：智能体可观测性是当前 AI 工程化的核心痛点，做智能体应用开发的团队值得关注——SmithDB 可能解决你调试和监控智能体行为的头疼问题。

原文

6月8日

22:44

LangChain@LangChainAI

LangChain 分享了一个真实案例：一个编码代理在夜间陷入重试循环，到早上已调用 LLM 达 10,000 次，产生四位数的账单。问题在于，可观测性只能事后告诉你发生了什么，而无法在事前阻止。要避免此类问题，需要在请求层强制执行策略，例如限制重试次数或设置调用上限。这提醒开发者，构建可靠 AI 代理时，策略控制比事后监控更重要。

行业编码代理成本控制 LLM调用可观测性策略执行

推荐理由：做 AI 代理开发的团队都会遇到这类成本失控风险，LangChain 这个案例直接点出了「事后监控 vs 事前策略」的痛点，建议在部署前就加上请求层限制。

原文

6月4日

06:44

Augment Code@augmentcode

Augment 推出了名为 Cosmos 的新平台，旨在帮助企业大规模部署 AI 智能体。Cosmos 支持在用户自己的环境或 Augment 的环境中运行，并允许用户选择自己喜欢的模型。该平台提供了可观测性、审计追踪和人工监督功能，以满足企业级部署对安全性和合规性的要求。这对于希望将 AI 智能体投入生产环境的团队来说是一个重要的基础设施选择。

AI产品智能体部署平台 Augment 可观测性企业级

推荐理由：做 AI 智能体工程化的团队终于有了一个兼顾灵活性和合规性的部署方案——Cosmos 支持自选模型和完整审计，适合需要将智能体落地到生产环境的企业开发者直接评估。

原文

6月3日

21:11

Harrison Chase@hwchase17

LangSmith 宣布推出三项新功能：沙盒（Sandbox）、网关（Gateway）和可观测性（Observability）。沙盒提供安全的测试环境，网关作为模型路由层，可观测性则用于监控和调试 LLM 应用。这些功能旨在完善 AI 代理平台的必备能力，帮助开发者更高效地构建和部署 LLM 应用。LangSmith 是 LangChain 旗下的 LLM 应用开发与监控平台，此次更新进一步强化了其作为全栈工具的地位。

AI产品 LangSmith 沙盒网关可观测性 LLM 应用开发

推荐理由：LangSmith 补齐了代理平台的关键拼图，做 LLM 应用开发的团队可以直接用沙盒测试、网关路由、可观测性监控，省去自己搭基础设施的麻烦。

原文

00:49

Y Combinator@ycombinator

Sazabi 是一款专为快速迭代的 AI 原生工程团队打造的新一代可观测性平台。它旨在替代 Datadog、Sentry、Grafana 或 Axiom 等传统工具，声称能让团队效率提升 10 倍。该平台由 Y Combinator 支持，创始人 @shcallaway 宣布正式上线。对于正在寻找更高效监控方案的 AI 团队来说，这是一个值得关注的新选择。

AI产品可观测性 AI 原生工程 Sazabi YC 创业监控平台

推荐理由：Sazabi 瞄准了 AI 原生团队的可观测性痛点，声称比现有方案快 10 倍，正在用 Datadog 或 Grafana 的团队值得关注这个 YC 新秀。

原文

6月2日

10:06

LangChain@LangChainAI

LangSmith Engine 正式发布，用户可通过三个简单步骤快速上手：连接追踪项目、可选连接代码仓库、审查并合并改进。该引擎旨在提供主动式智能体工程师体验，帮助开发者更高效地管理和优化 AI 应用。LangSmith 是 LangChain 推出的可观测性平台，此次更新进一步降低了使用门槛。

AI产品 LangSmith 可观测性追踪 LangChain 智能体

推荐理由：做 AI 应用开发的团队终于有了更丝滑的追踪工具——三步就能接入，省去繁琐配置，建议用 LangChain 的开发者直接试。

原文

5月25日

12:45

marktechpost@Sana Hassan

精选

本文是一篇教程，指导读者使用 Langfuse（一个开源 LLM 工程平台）构建完整的可观测性与评估管道。教程涵盖了追踪、提示管理、评分、数据集和实验等核心功能。它支持使用真实的 OpenAI 密钥或确定性模拟 LLM，让读者无需付费模型访问即可理解所有主要功能。文章提供了逐步实现的工作流程，适合希望系统学习 LLM 工程实践的开发者。

技巧 Langfuse 可观测性 LLM 工程提示管理评估管道

推荐理由：想系统掌握 LLM 应用的可观测性与评估？这篇教程用 Langfuse 手把手带你走通追踪、提示管理、评分和实验全流程，还支持模拟 LLM 免费用。做 LLM 工程或运维的团队值得收藏。

原文

5月22日

08:06

Notion@NotionHQ

Notion 发布了 Custom Agent Insights 功能，让用户能够实时查看智能体的每一次运行过程。该功能旨在解决智能体行为不透明的问题，提供完整的运行日志和可视化。目前该功能正在逐步推出，用户无需再猜测智能体在做什么。

AI产品 Notion 智能体可观测性自动化产品更新

推荐理由：Notion 用户终于能看清智能体每一步操作了，做自动化工作流的团队可以直接用起来，减少调试时的盲猜。

原文

5月21日

07:59

LangChain@LangChainAI

精选

LangChain 应用 AI 工程师 Palash Shah 在 X 上分享了 LangSmith Engine 的技术细节，深入讲解了其内部架构和工作原理。LangSmith Engine 是 LangChain 平台的核心组件，用于追踪、评估和优化 LLM 应用。这次分享帮助开发者理解如何更高效地使用 LangSmith 进行 AI 应用的可观测性和调试。对于使用 LangChain 构建生产级 AI 应用的团队来说，这是了解平台底层机制的好机会。

AI产品 LangChain LangSmith Engine 可观测性 LLM 应用调试

推荐理由：LangSmith Engine 是 LangChain 生态的调试和监控核心，做 LLM 应用生产的开发者值得了解其内部机制，能帮你更精准地定位问题。

原文

5月19日

23:42

Ate-a-Pi@svpino

开发者Santiago Valdarrama分享了一种极简方法，只需引入一个库并添加一行代码，即可为基于LLM的应用开启完整的可观测性和自动分析功能。该方法能免费获取大量关键信息，如请求延迟、Token消耗、错误率等，极大简化了调试和性能监控流程。对于构建和部署LLM应用的团队来说，这是一个无需思考的实用技巧。

技巧 LLM 可观测性监控调试一行代码

推荐理由：做LLM应用开发的团队，监控调试一直是个痛点——现在一行代码就能拿到全链路数据，省去自己搭监控的麻烦，建议直接试。

原文

13:36

LangChain@LangChainAI

精选

LangChain 发布了 SmithDB，一个专为智能体可观测性和评估工作负载构建的数据层。它支持在大量追踪数据上以低延迟执行复杂查询，并满足自托管和多云部署的需求。SmithDB 采用全新架构，解决了传统数据库在处理智能体系统时面临的性能与扩展性挑战。该产品旨在帮助开发者更高效地监控、调试和评估 AI 智能体的行为。

AI产品智能体可观测性 LangChain 数据层评估

推荐理由：做智能体开发和运维的团队终于有了专门的数据层——SmithDB 解决了大规模追踪数据下的查询延迟和自托管痛点，值得关注。

原文

12:44

arXiv: OpenAI@Dhairya Dalal, Endre Sara, Ben Yemini, Christine Miller, Shmuel Kliger

精选72°

Causely 提出一种因果智能层，将原始可观测性遥测数据转化为结构化的拓扑与因果模型，为AI代理提供语义和因果基础。在24微服务的OpenTelemetry演示应用中，通过注入故障进行基准测试，对比Claude Code、OpenAI Codex等四种代理配置。实验显示，使用Causely后，平均诊断时间降低63%，令牌消耗减少60%，工具调用次数下降78%，根因诊断准确率从75%提升至100%。该方法解决了AI代理在SRE场景中因缺乏环境因果理解而导致的效率低下和成本高昂问题。

论文因果推理 SRE/运维 AI代理可观测性故障诊断

推荐理由：做SRE或运维自动化的团队，终于有了让AI代理真正理解生产环境因果关系的方案——诊断时间砍半、成本降六成，值得直接拿demo试试。

原文

00:38

LangChain@LangChainAI

精选

LangChain 发布 LangSmith 的新架构 SmithDB，由对象存储、Postgres 元存储和无状态三组件构成。核心体验性能最高提升 12 倍。新架构使自部署和多云环境配置更简便，解决代理开发中的可观测性瓶颈。

AI产品 LangSmith LangChain 可观测性智能体性能优化

推荐理由：LangSmith 性能快了 12 倍，部署更简单

原文

5月13日

00:33

00:33Google Developers Blog（博客/媒体）

谷歌发布 ADK Go 1.0，将 AI 智能体开发从实验性脚本转向生产级服务。新版本原生集成 OpenTelemetry 实现深度追踪、新增插件系统支持自愈逻辑，并引入“人在回路”确认机制保障敏感操作安全。同时支持 YAML 配置快速迭代，并优化 Agent2Agent（A2A）协议实现跨语言通信。此次更新让开发者能基于 Golang 的高性能工程标准构建可靠的多智能体系统。

AI产品智能体 ADK Go 可观测性 A2A协议生产部署

推荐理由：该版本补齐了 AI 智能体在生产环境中的可观测性、安全性和可维护性短板，对 Golang 技术栈构建复杂多智能体系统的团队意义重大。

原文

00:33

00:33Google Developers Blog（博客/媒体）

Google博客分享将脆弱的销售研究原型重构为生产级AI智能体的经验，基于Agent Development Kit (ADK)。通过用编排子智能体替代单体脚本，并使用Pydantic结构化输出，消除了静默失败和脆弱解析问题。文章强调动态RAG管道和OpenTelemetry可观测性对确保AI智能体可扩展、低成本且透明至关重要。

技巧智能体 MCP/工具 Google ADK 可观测性 RAG

推荐理由：本文提供了实用的工程经验，尤其适合正在将AI原型投入生产的开发者，展示了结构化设计和监控的重要性。

原文