14:11Harrison Chase@hwchase17精选开发者 Saurabh 强调,Agent 必须有可观测性。他用 LangGraph 做编排,LangSmith 做追踪、评估和回归测试。如果无法解释 Agent 为何给出某个回答,那就只是 demo 而非架构。他建议通过 tracing 捕获 prompt 和工具调用的全部上下文。技巧LangGraphLangSmithAgent可观测性智能体推荐理由:如果你在用 LangGraph 做 agent,这招能帮你从 demo 变成可交付的系统——关键是 LangSmith 的 trace 和 eval。原文
21:38LangChain@LangChainAI精选Lyft 利用 LangChain 构建了 8 个 AI Agent,这些 Agent 能完全解决 35% 的客户问题。在 LangChain 的 Interrupt 会议上,Lyft 分享了内部使用的评估方法,以及如何通过 LangSmith 扩展评估规模。他们还总结了在开发过程中学到的经验教训。技巧LyftLangChainLangSmith智能体客户服务推荐理由:Lyft 用 LangChain 做了 8 个 AI Agent,直接干掉 35% 的客服工单,还分享了评估细节。原文
03:04LangChain@LangChainAI精选LangChain 推出了 Deep Agents,一个开源智能体框架,旨在构建能够规划、使用工具、委托子代理、写入文件并长时间工作的智能体。该框架提供了一个可管理的环境,并集成到 LangSmith 中,为开发者提供持久化的智能体运行和监控能力。这一发布降低了构建复杂、长周期智能体的门槛,适合需要自动化多步骤任务的团队。AI产品智能体开源/仓库LangChainLangSmith工具调用推荐理由:LangChain 的 Deep Agents 解决了构建长周期、多步骤智能体的痛点,做自动化流程或复杂任务编排的开发者可以直接上手试试。原文
02:12LangChain@LangChainAI精选LangChain 提出每个智能体都需要一台“计算机”,关键在于如何安全地提供。他们推出了 LangSmith Sandboxes,作为解决方案,旨在为 AI 智能体提供隔离、可控的执行环境。这解决了智能体在运行代码或访问资源时的安全风险问题,让开发者能更放心地部署自主代理。该功能目前已在 LangSmith 平台上线,值得关注。AI产品智能体安全LangChainLangSmith沙箱推荐理由:LangChain 解决了智能体安全执行的核心痛点,做自主代理开发的团队可以直接用 Sandboxes 隔离风险,建议点开看看具体实现。原文
23:42LangChain@LangChainAI精选LangSmith Engine 现在能针对每个检测到的问题自动提出三种解决动作:1)自动起草代码或提示词变更并开 PR,供用户审查合并;2)创建针对该问题的自定义在线评估器,防止复发;3)将失败的线上案例加入离线评估数据集,持续提升评估覆盖率。这意味着开发者无需手动排查和修复,系统能主动生成修复方案并扩展测试集,大幅降低 AI 应用维护成本。AI产品LangSmithAI 运维自动修复评估器PR 自动化推荐理由:做 AI 应用运维的团队终于可以告别手动修 Bug 了——LangSmith Engine 自动开 PR 和生成评估器,建议直接集成到工作流里试试。原文
08:38LangChain@LangChainAI精选LangSmith Sandboxes 正式发布 GA 版本,新增快照和低成本分支功能。用户可以捕获运行中的沙箱状态,并以接近单个沙箱的成本创建最多 10 个并行分支。当智能体走向错误路径时,可快速恢复快照并尝试不同分支,大幅提升调试和实验效率。该功能旨在帮助开发者更灵活地管理 AI 智能体的开发与测试流程。AI产品LangSmith沙箱快照分支智能体调试推荐理由:做 AI 智能体开发和测试的团队,终于可以低成本并行实验不同路径了——快照恢复功能让试错成本降到最低,建议直接上手体验。原文
10:09LangChain@LangChainAI精选LangChain 展示了一个由 Deep Agents、LangSmith 和 You.com 金融研究 API 驱动的宏观经济研究智能体。该智能体能够自动分析 GDP 数据、检测异常、在行业层面调查结构性和周期性驱动因素,并生成带有引用的结构化简报。这展示了 AI 智能体在专业金融研究领域的应用潜力,能够大幅提升宏观经济分析的效率和准确性。AI产品智能体宏观经济金融研究LangSmithDeep Agents推荐理由:做宏观经济研究或金融分析的团队,可以直接参考这个智能体架构来搭建自己的自动化分析工具,省去手动收集数据和撰写报告的时间。原文
10:05Harrison Chase@hwchase17精选LangChain 宣布 LangSmith Sandboxes 正式可用,这是一个让智能体安全编写和执行代码的沙箱环境。该沙箱与运行时隔离,支持网络控制、持久化状态,并在出错时提供快照/恢复功能。LangChain 创始人认为未来所有智能体都需要具备写代码和执行代码的能力。开发者可在 20 分钟内学会如何安全运行智能体代码。AI产品智能体沙箱LangSmith代码执行安全推荐理由:智能体安全执行代码是构建可靠 AI 系统的关键,做智能体开发的团队可以直接用这个沙箱来隔离风险,建议试试。原文
23:26Harrison Chase@hwchase17精选LangSmith 与 AWS 联合发布了一篇深度博客,详细介绍了如何使用 LangSmith 评估 Deep Agents(长周期智能体)。文章涵盖了数据点设计和评估器设计,针对长周期智能体的评估挑战提供了实用方案。这对于构建和优化复杂智能体的开发者具有重要参考价值。AI产品智能体评估LangSmithAWS长周期智能体推荐理由:长周期智能体的评估一直是个难题,这篇博客给出了具体的数据点和评估器设计方法,做智能体开发的团队可以直接参考实践。原文
08:28LangChain@LangChainAI精选LangSmith 推出 LLM Gateway 功能,能在请求到达模型或记录到追踪数据之前自动脱敏敏感信息(如 SSN)。此前,包含敏感数据的请求会直接进入 LLM 提供商日志、追踪数据甚至下游系统,存在隐私泄露风险。该功能解决了 AI 应用开发中数据隐私保护的关键痛点,尤其适合处理个人身份信息的场景。AI产品LangSmithLLM Gateway数据脱敏隐私保护AI 应用安全1 个信源在谈推荐理由:做 AI 应用开发的团队终于有了一个简单有效的数据脱敏方案,尤其是处理用户隐私数据的场景,建议直接集成到你的 LLM 调用流程中。原文
08:11LangChain@LangChainAI精选LangChain 发布了 Deep Agents v0.6,新增 ContextHubBackend 功能。该功能为驱动智能体行为的文件提供了一个版本化的存储空间,基于 LangSmith Context Hub 实现。它允许开发者从一次运行到下一次运行持续改进上下文,提升智能体的一致性和表现。这对于需要精细控制智能体行为的团队来说是一个实用更新。AI产品智能体LangChainLangSmith版本控制上下文管理推荐理由:做智能体开发的团队终于有了版本化的上下文管理工具,能避免每次调试都从头开始,建议用 LangChain 的开发者直接升级试试。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
10:08LangChain@LangChainAI精选Lyft 利用 LangGraph 和 LangSmith 将智能体开发周期从 6 个月缩短至数周,同时幻觉率降低 20%,AI 解决率提升 16%。这表明 LangChain 的工具链在加速企业级 AI 智能体落地方面效果显著。对于正在构建或优化 AI 客服、自动化流程的团队,这是一个值得参考的案例。AI产品智能体LangGraphLangSmithLyft开发效率推荐理由:Lyft 的实践证明了 LangGraph 和 LangSmith 能大幅缩短智能体开发周期并提升质量,做 AI 客服或自动化流程的团队可以直接借鉴,建议点开看看具体怎么做到的。原文
09:49LangChain@LangChainAI精选LangChain 发布了 LangSmith Context Hub,为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。AI产品LangSmithContext HubAgent上下文管理开源/仓库推荐理由:做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题,建议做 AI 应用架构的开发者点开视频看看。原文
11:02LangChain@LangChainAI精选LangChain 推出了 Mission Control,一个运行在 Kubernetes 集群内的解耦应用,用于部署、配置、观察和排查自托管的 LangSmith 及相关 LangChain 基础设施。它无需 ingress、外部控制平面或额外数据库,完全在本地访问。这简化了自托管 LangSmith 的运维复杂度,适合需要私有化部署的团队。目前该项目已在 X 上获得关注,但尚未公开仓库链接。AI产品LangChainLangSmithKubernetes自托管运维工具推荐理由:自托管 LangSmith 的团队终于有了一个轻量运维方案——Mission Control 省去了 ingress 和外部控制平面,直接在 K8s 内搞定部署和监控,做 LLM 应用基础设施的开发者值得关注。原文
08:06LangChain@LangChainAI精选DataboxHQ 分享了他们如何使用 LangSmith 评估其多轮对话分析智能体 Genie。Genie 是一个能处理复杂数据分析任务的智能体,需要多轮交互才能完成用户请求。LangSmith 提供了评估框架,帮助团队追踪智能体的表现、识别错误并优化对话流程。这一实践展示了如何系统性地评估多轮智能体,对构建可靠 AI 助手的团队有参考价值。AI产品智能体评估框架LangSmith数据分析多轮对话推荐理由:做多轮对话智能体的团队终于有了可落地的评估方案——LangSmith 帮 Databox 把 Genie 的对话质量量化了,建议做 AI 分析助手的开发者点开看看具体怎么做的。原文
08:00LangChain@LangChainAI精选LangSmith Engine 是 LangChain 推出的新工具,旨在加速智能体开发流程。它能自动分析 Agent 运行中的失败模式,生成代码修复建议,并推荐评估覆盖范围。开发者无需手动追踪日志,即可快速定位和解决问题。这显著提升了 Agent 的调试和迭代效率。AI产品智能体LangSmith调试工具开发效率LangChain推荐理由:做 Agent 开发的团队终于不用手动翻日志了——LangSmith Engine 自动找故障、写修复、提评估建议,建议所有用 LangChain 的开发者直接试试。原文
07:57LangChain@LangChainAI精选LangSmith Sandboxes 正式发布,为 AI Agent 提供隔离的真实文件系统、Shell 和包管理器。该功能与 Deep Agents、Open SWE 及用户自有代码兼容,使用现有 API 密钥即可认证,无需额外构建或管理运行时。这解决了 Agent 在沙盒环境中执行复杂操作的安全与隔离问题,让开发者能更安全地测试和运行 Agent 代码。AI产品Agent沙盒LangSmith安全隔离开发者工具推荐理由:做 Agent 开发的团队终于有了开箱即用的隔离沙盒,不用自己搭环境就能安全跑代码,建议直接试试。原文