00:23AK@_akhaliq精选DynaFLIP 提出一种基于三模态(视觉、触觉、动力学)的表示学习方法,用于提升机器人对物体动态交互的理解。在 RoboTouch 和 DexYCB 等基准上,DynaFLIP 相比单模态基线提升了 15% 的抓取成功率。该方法利用自监督动力学预测任务对齐多模态特征,无需大量标注数据。实验显示,DynaFLIP 在零样本迁移到新物体时泛化性优于现有方法。AI模型DynaFLIP机器人感知多模态表示学习推荐理由:让机器人看懂手-物交互原文