精选理由
做通用智能体研究的团队会发现,当前缩放策略的盲点被戳中了——环境规则集的分布偏移才是泛化瓶颈,值得重新审视自己的实验设计。
这篇立场论文提出,通用智能体需要环境缩放(environment scaling)来适应训练分布之外的多样任务和未见环境。当前缩放实践主要关注在固定交互规则下收集更多经验或任务,导致智能体在底层接口、动态、观测或反馈信号变化时表现脆弱。作者将轨迹缩放、任务缩放和环境缩放区分开来,并提出了统一分类法。论文对比了程序化生成器(可控、可验证)和生成式世界模型(覆盖广、开放)两种构建可扩展环境的范式。最后,论文认为可扩展环境是实现鲁棒通用智能体的关键基础。
AI 翻译 · 中文
这篇立场论文提出,通用智能体需要环境缩放(environment scaling)来适应训练分布之外的多样任务和未见环境。当前缩放实践主要关注在固定交互规则下收集更多经验或任务,导致智能体在底层接口、动态、观测或反馈信号变化时表现脆弱。作者将轨迹缩放、任务缩放和环境缩放区分开来,并提出了统一分类法。论文对比了程序化生成器(可控、可验证)和生成式世界模型(覆盖广、开放)两种构建可扩展环境的范式。最后,论文认为可扩展环境是实现鲁棒通用智能体的关键基础。
Generalizable agents should adapt to diverse tasks and unseen environments beyond their training distribution. This position paper argues that such generalization requires environment scaling: expanding the distribution …