LeHome Challenge 2026叠衣方案:线上第一、线下第二

Learning to Fold: prizewinning solution at LeHome Challenge 2026 (1st place online, 2nd offline)

精选理由

一个靠强化学习微调VLA在叠衣服任务上拿第一的方案,工程细节丰富,从训练到部署都有具体做法。

AI 摘要

该解决方案在ICRA 2026的LeHome Challenge双手机器人叠衣比赛中获得线上62支队伍第一名、线下决赛第二名。核心是将视觉-语言-动作(VLA)策略与强化学习循环结合,使同一网络既预测动作又预测成功率和未来量。方法组合了AWR+RECAP用于流匹配VLA,通过HuggingFace Hub实现异步分布式训练/部署管线,并采用Thompson采样优化推理时超参数。模拟到现实的迁移使用相机对齐工具、数据增强和DAgger式人类干预数据采集。

AI 翻译 · 中文

该解决方案在ICRA 2026的LeHome Challenge双手机器人叠衣比赛中获得线上62支队伍第一名、线下决赛第二名。核心是将视觉-语言-动作(VLA)策略与强化学习循环结合,使同一网络既预测动作又预测成功率和未来量。方法组合了AWR+RECAP用于流匹配VLA,通过HuggingFace Hub实现异步分布式训练/部署管线,并采用Thompson采样优化推理时超参数。模拟到现实的迁移使用相机对齐工具、数据增强和DAgger式人类干预数据采集。

arXiv cs.AII describe my solution to the LeHome Challenge 2026, an ICRA 2026 competition on bimanual garment folding. The system placed 1st of 62 teams in the online (simulation) round and 2nd in the real-world final. It improves a