11:04arXiv cs.AI@Adam Wei, Nicholas Pfaff, Thomas Cohn, Arif Kerem Dayı, Constantinos Daskalakis, Giannis Daras, Russ Tedrake精选72°机器人领域的高质量任务数据昂贵且难以收集,而次优数据(低质量或分布外演示)却大量存在。现有方法在同时训练两类数据时,常无法区分次优样本中的有用和有害特征。Ambient Diffusion Policy 通过引入噪声依赖的数据使用策略,仅在高和低扩散时间步利用次优数据,从而提取有用特征。该方法基于机器人动作数据的频谱幂律分布,利用全局到局部层次和局部性两个性质。在六项任务上,针对四种次优数据(噪声轨迹、仿真到现实差距、任务不匹配、大规模数据混合),该方法均有效,并在 Open X-Embodiment 数据集上比现有方法提升高达33%。论文机器人模仿学习扩散策略次优数据Open X-Embodiment推荐理由:机器人团队终于有了一个能高效利用次优数据的实用方法——Ambient Diffusion Policy 解决了低质量数据难以训练的问题,做机器人模仿学习的开发者可以直接在现有数据集上尝试,有望大幅降低数据收集成本。原文