全部 AI 动态 · AI 热点

arXiv cs.AI@Xinyu Che, Junqi Xiong, Yunfei Ge, Xinping Lei, Shihao Li, Hang Yan, Han Li, Yuanxing Zhang, Zhiqi Bai, Jinhua Hao, Ming Sun, Han Li, Jiaheng Liu

网络上有大量多模态、异构、嘈杂的程序性知识，但直接用于智能体执行长周期任务效果不佳。研究者提出 guide-to-skill 学习问题，并发布首个基准 MMG2Skill-Bench。他们设计的闭环框架 MMG2Skill 能将人类指南编译为可编辑技能，在执行时条件化固定视觉语言模型，并通过轨迹级根因反馈持续修正技能。在 GUI 控制、开放游戏和策略卡牌等六个 VLM 骨干上，该方法比基线提升 12.8 到 25.3 个百分点。消融实验表明，直接提示原始指南反而会降低性能，而结构化技能构建和轨迹驱动修正是关键。

论文智能体技能蒸馏多模态长周期任务闭环学习

推荐理由：做智能体长任务规划的团队终于有了把网络教程变成可执行技能的方案——MMG2Skill 直接解决了指南与技能之间的鸿沟，做 GUI 自动化或游戏 AI 的开发者可以试试这个闭环框架。

原文

5月28日

09:54

Harrison Chase@hwchase17

LangChain 推出 Managed Deep Agents，旨在简化构建和部署需要长时间运行、使用工具、保持上下文并生成产物的智能体。该服务目前处于私有预览阶段，团队可通过私信申请访问。已有团队在构建支持与分类、研究、编程、数据分析和内部运营等类型的智能体。这降低了长周期智能体的开发门槛，适合需要复杂任务自动化的开发者。

AI产品 LangChain 智能体长周期任务私有预览自动化

推荐理由：LangChain 把长周期智能体的部署门槛降下来了，做支持、研究或数据分析自动化的团队可以直接申请试用，省去自己搭建基础设施的麻烦。

原文

05:08

LangChain@LangChainAI

LangChain 发布了 Managed Deep Agents，专为需要长时间运行、使用工具、保持上下文并生成产物的智能体设计。该产品支持多种应用场景，包括客服与分类智能体、研究智能体、编程智能体、数据分析智能体和内部运营智能体。它解决了传统智能体在长周期任务中上下文丢失和工具调用不稳定的问题。团队可以基于此构建更可靠、更自主的自动化工作流。

AI产品 LangChain 智能体长周期任务自动化工具调用

推荐理由：做复杂自动化任务的团队终于有了专门的长周期智能体方案——LangChain 的 Managed Deep Agents 解决了上下文丢失和工具调用稳定性问题，做客服、研究、编程或数据分析的开发者可以直接用来构建更可靠的自主工作流。

原文

5月24日

05:19

AI Engineer@aiDotEngineer

精选

Anthropic 举办了一场 75 分钟的工作坊，由 Ash Prabaker 和 Andrew Wilson 主讲，展示了如何构建能够持续运行数小时的智能体，而非传统智能体仅能存活几秒。工作坊聚焦于解决智能体在长时间任务中的持久性和可靠性问题，提供了实用的构建方法和设计原则。这对于需要执行复杂、长周期任务的 AI 应用开发者具有重要参考价值。

AI产品智能体 Anthropic 长周期任务工作坊持久性

推荐理由：做长周期 AI 智能体开发的团队，终于有了可落地的方案——Anthropic 直接给出了让智能体从秒级存活到小时级的方法，建议点开工作坊回放学习。

原文

5月19日

13:13

OpenRouter@OpenRouterAI

精选76°

OpenRouter 推出了一套用于构建长周期智能体的基础原语，旨在解决 AI 智能体在长时间任务中的可靠性和可扩展性问题。这些原语提供了模块化的构建块，帮助开发者更高效地设计能够持续运行数小时甚至数天的智能体。该发布引起了社区关注，已有近千次浏览，表明开发者对长周期智能体开发工具的需求强烈。

AI产品智能体长周期任务 OpenRouter 开发工具自动化

推荐理由：OpenRouter 这套原语解决了长周期智能体开发中的核心痛点，做复杂自动化任务的团队可以直接参考，省去自己造轮子的时间。

原文