精选 AI 资讯 · AI 热点

6月16日

14:11

Harrison Chase@hwchase17

精选

开发者 Saurabh 强调，Agent 必须有可观测性。他用 LangGraph 做编排，LangSmith 做追踪、评估和回归测试。如果无法解释 Agent 为何给出某个回答，那就只是 demo 而非架构。他建议通过 tracing 捕获 prompt 和工具调用的全部上下文。

技巧 LangGraph LangSmith Agent 可观测性智能体

推荐理由：如果你在用 LangGraph 做 agent，这招能帮你从 demo 变成可交付的系统——关键是 LangSmith 的 trace 和 eval。

原文

6月15日

21:38

LangChain@LangChainAI

精选

Lyft 利用 LangChain 构建了 8 个 AI Agent，这些 Agent 能完全解决 35% 的客户问题。在 LangChain 的 Interrupt 会议上，Lyft 分享了内部使用的评估方法，以及如何通过 LangSmith 扩展评估规模。他们还总结了在开发过程中学到的经验教训。

技巧 Lyft LangChain LangSmith 智能体客户服务

推荐理由：Lyft 用 LangChain 做了 8 个 AI Agent，直接干掉 35% 的客服工单，还分享了评估细节。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

03:04

LangChain@LangChainAI

精选

LangChain 推出了 Deep Agents，一个开源智能体框架，旨在构建能够规划、使用工具、委托子代理、写入文件并长时间工作的智能体。该框架提供了一个可管理的环境，并集成到 LangSmith 中，为开发者提供持久化的智能体运行和监控能力。这一发布降低了构建复杂、长周期智能体的门槛，适合需要自动化多步骤任务的团队。

AI产品智能体开源/仓库 LangChain LangSmith 工具调用

推荐理由：LangChain 的 Deep Agents 解决了构建长周期、多步骤智能体的痛点，做自动化流程或复杂任务编排的开发者可以直接上手试试。

原文

02:12

LangChain@LangChainAI

精选

LangChain 提出每个智能体都需要一台“计算机”，关键在于如何安全地提供。他们推出了 LangSmith Sandboxes，作为解决方案，旨在为 AI 智能体提供隔离、可控的执行环境。这解决了智能体在运行代码或访问资源时的安全风险问题，让开发者能更放心地部署自主代理。该功能目前已在 LangSmith 平台上线，值得关注。

AI产品智能体安全 LangChain LangSmith 沙箱

推荐理由：LangChain 解决了智能体安全执行的核心痛点，做自主代理开发的团队可以直接用 Sandboxes 隔离风险，建议点开看看具体实现。

原文

6月8日

23:42

LangChain@LangChainAI

精选

LangSmith Engine 现在能针对每个检测到的问题自动提出三种解决动作：1）自动起草代码或提示词变更并开 PR，供用户审查合并；2）创建针对该问题的自定义在线评估器，防止复发；3）将失败的线上案例加入离线评估数据集，持续提升评估覆盖率。这意味着开发者无需手动排查和修复，系统能主动生成修复方案并扩展测试集，大幅降低 AI 应用维护成本。

AI产品 LangSmith AI 运维自动修复评估器 PR 自动化

推荐理由：做 AI 应用运维的团队终于可以告别手动修 Bug 了——LangSmith Engine 自动开 PR 和生成评估器，建议直接集成到工作流里试试。

原文

6月3日

08:38

LangChain@LangChainAI

精选

LangSmith Sandboxes 正式发布 GA 版本，新增快照和低成本分支功能。用户可以捕获运行中的沙箱状态，并以接近单个沙箱的成本创建最多 10 个并行分支。当智能体走向错误路径时，可快速恢复快照并尝试不同分支，大幅提升调试和实验效率。该功能旨在帮助开发者更灵活地管理 AI 智能体的开发与测试流程。

AI产品 LangSmith 沙箱快照分支智能体调试

推荐理由：做 AI 智能体开发和测试的团队，终于可以低成本并行实验不同路径了——快照恢复功能让试错成本降到最低，建议直接上手体验。

原文

6月2日

10:09

LangChain@LangChainAI

精选

LangChain 展示了一个由 Deep Agents、LangSmith 和 You.com 金融研究 API 驱动的宏观经济研究智能体。该智能体能够自动分析 GDP 数据、检测异常、在行业层面调查结构性和周期性驱动因素，并生成带有引用的结构化简报。这展示了 AI 智能体在专业金融研究领域的应用潜力，能够大幅提升宏观经济分析的效率和准确性。

AI产品智能体宏观经济金融研究 LangSmith Deep Agents

推荐理由：做宏观经济研究或金融分析的团队，可以直接参考这个智能体架构来搭建自己的自动化分析工具，省去手动收集数据和撰写报告的时间。

原文

10:05

Harrison Chase@hwchase17

精选

LangChain 宣布 LangSmith Sandboxes 正式可用，这是一个让智能体安全编写和执行代码的沙箱环境。该沙箱与运行时隔离，支持网络控制、持久化状态，并在出错时提供快照/恢复功能。LangChain 创始人认为未来所有智能体都需要具备写代码和执行代码的能力。开发者可在 20 分钟内学会如何安全运行智能体代码。

AI产品智能体沙箱 LangSmith 代码执行安全

推荐理由：智能体安全执行代码是构建可靠 AI 系统的关键，做智能体开发的团队可以直接用这个沙箱来隔离风险，建议试试。

原文

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月31日

23:26

Harrison Chase@hwchase17

精选

LangSmith 与 AWS 联合发布了一篇深度博客，详细介绍了如何使用 LangSmith 评估 Deep Agents（长周期智能体）。文章涵盖了数据点设计和评估器设计，针对长周期智能体的评估挑战提供了实用方案。这对于构建和优化复杂智能体的开发者具有重要参考价值。

AI产品智能体评估 LangSmith AWS 长周期智能体

推荐理由：长周期智能体的评估一直是个难题，这篇博客给出了具体的数据点和评估器设计方法，做智能体开发的团队可以直接参考实践。

原文

5月29日

08:28

LangChain@LangChainAI

精选

LangSmith 推出 LLM Gateway 功能，能在请求到达模型或记录到追踪数据之前自动脱敏敏感信息（如 SSN）。此前，包含敏感数据的请求会直接进入 LLM 提供商日志、追踪数据甚至下游系统，存在隐私泄露风险。该功能解决了 AI 应用开发中数据隐私保护的关键痛点，尤其适合处理个人身份信息的场景。

AI产品 LangSmith LLM Gateway 数据脱敏隐私保护 AI 应用安全

推荐理由：做 AI 应用开发的团队终于有了一个简单有效的数据脱敏方案，尤其是处理用户隐私数据的场景，建议直接集成到你的 LLM 调用流程中。

原文

08:11

LangChain@LangChainAI

精选

LangChain 发布了 Deep Agents v0.6，新增 ContextHubBackend 功能。该功能为驱动智能体行为的文件提供了一个版本化的存储空间，基于 LangSmith Context Hub 实现。它允许开发者从一次运行到下一次运行持续改进上下文，提升智能体的一致性和表现。这对于需要精细控制智能体行为的团队来说是一个实用更新。

AI产品智能体 LangChain LangSmith 版本控制上下文管理

推荐理由：做智能体开发的团队终于有了版本化的上下文管理工具，能避免每次调试都从头开始，建议用 LangChain 的开发者直接升级试试。

原文

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

5月28日

10:08

LangChain@LangChainAI

精选

Lyft 利用 LangGraph 和 LangSmith 将智能体开发周期从 6 个月缩短至数周，同时幻觉率降低 20%，AI 解决率提升 16%。这表明 LangChain 的工具链在加速企业级 AI 智能体落地方面效果显著。对于正在构建或优化 AI 客服、自动化流程的团队，这是一个值得参考的案例。

AI产品智能体 LangGraph LangSmith Lyft 开发效率

推荐理由：Lyft 的实践证明了 LangGraph 和 LangSmith 能大幅缩短智能体开发周期并提升质量，做 AI 客服或自动化流程的团队可以直接借鉴，建议点开看看具体怎么做到的。

原文

09:49

LangChain@LangChainAI

精选

LangChain 发布了 LangSmith Context Hub，为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。

AI产品 LangSmith Context Hub Agent 上下文管理开源/仓库

推荐理由：做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题，建议做 AI 应用架构的开发者点开视频看看。

原文

5月27日

11:02

LangChain@LangChainAI

精选

LangChain 推出了 Mission Control，一个运行在 Kubernetes 集群内的解耦应用，用于部署、配置、观察和排查自托管的 LangSmith 及相关 LangChain 基础设施。它无需 ingress、外部控制平面或额外数据库，完全在本地访问。这简化了自托管 LangSmith 的运维复杂度，适合需要私有化部署的团队。目前该项目已在 X 上获得关注，但尚未公开仓库链接。

AI产品 LangChain LangSmith Kubernetes 自托管运维工具

推荐理由：自托管 LangSmith 的团队终于有了一个轻量运维方案——Mission Control 省去了 ingress 和外部控制平面，直接在 K8s 内搞定部署和监控，做 LLM 应用基础设施的开发者值得关注。

原文

5月22日

08:06

LangChain@LangChainAI

精选

DataboxHQ 分享了他们如何使用 LangSmith 评估其多轮对话分析智能体 Genie。Genie 是一个能处理复杂数据分析任务的智能体，需要多轮交互才能完成用户请求。LangSmith 提供了评估框架，帮助团队追踪智能体的表现、识别错误并优化对话流程。这一实践展示了如何系统性地评估多轮智能体，对构建可靠 AI 助手的团队有参考价值。

AI产品智能体评估框架 LangSmith 数据分析多轮对话

推荐理由：做多轮对话智能体的团队终于有了可落地的评估方案——LangSmith 帮 Databox 把 Genie 的对话质量量化了，建议做 AI 分析助手的开发者点开看看具体怎么做的。

原文

5月21日

08:00

LangChain@LangChainAI

精选

LangSmith Engine 是 LangChain 推出的新工具，旨在加速智能体开发流程。它能自动分析 Agent 运行中的失败模式，生成代码修复建议，并推荐评估覆盖范围。开发者无需手动追踪日志，即可快速定位和解决问题。这显著提升了 Agent 的调试和迭代效率。

AI产品智能体 LangSmith 调试工具开发效率 LangChain

推荐理由：做 Agent 开发的团队终于不用手动翻日志了——LangSmith Engine 自动找故障、写修复、提评估建议，建议所有用 LangChain 的开发者直接试试。

原文

07:57

LangChain@LangChainAI

精选

LangSmith Sandboxes 正式发布，为 AI Agent 提供隔离的真实文件系统、Shell 和包管理器。该功能与 Deep Agents、Open SWE 及用户自有代码兼容，使用现有 API 密钥即可认证，无需额外构建或管理运行时。这解决了 Agent 在沙盒环境中执行复杂操作的安全与隔离问题，让开发者能更安全地测试和运行 Agent 代码。

AI产品 Agent 沙盒 LangSmith 安全隔离开发者工具

推荐理由：做 Agent 开发的团队终于有了开箱即用的隔离沙盒，不用自己搭环境就能安全跑代码，建议直接试试。

原文