复杂任务 · AI 话题观测

§ 01综述

复杂任务是指需要多步推理、多工具调用或多个智能体协同才能完成的高难度目标，当前已成为衡量AI智能体系统能力的核心基准。随着大语言模型的发展，研究者正从简单对话转向解决真实世界中的复杂任务，并涌现出多种技术路径。

复杂任务近期进展

Subagentmaxxing方法：通过 /goal 指令和子智能体分工，显著提升复杂任务的执行效率。该方法允许主智能体将子任务委派给专用子智能体，实现结构化分解。原文标题

Antigravity 并行协作预览：为付费用户启用 /teamwork-preview，支持多个智能体在复杂任务中并行协作，提高任务完成速度与质量。原文标题

DeepAgents 生产部署概述：Harrison Chase 介绍了 DeepAgents 在处理复杂任务时的架构设计与生产环境部署挑战，强调可靠性与可扩展性。原文标题

RL 丰富反馈超越标量奖励：斯坦福 SAIL 与 ETH 合作发现，在复杂任务中使用多维度的丰富反馈信号，比单一标量奖励能更有效引导强化学习智能体学习策略。原文标题

当前焦点与观察点

当前复杂任务的研究焦点集中在多智能体协作机制、强化学习的反馈设计以及生产系统的可靠性上。Subagentmaxxing 和并行协作展示了分解与并行化的潜力，但如何平衡智能体间的通信开销与任务效率仍是关键问题。RL 方面，丰富反馈虽能提升学习效果，但其设计工程成本较高。在部署层面，复杂任务的稳定性和错误恢复能力尚待加强。总体而言，业界正从“能做”向“做得好”过渡，未来需在任务建模、训练策略和系统架构上进一步突破。

§ 02相关报道04 条在档

§ 03邻近话题