LIBERO 是机器人操作领域常用的基准数据集和仿真环境,近期多个工作围绕其任务展开。当前趋势聚焦于提升视觉-语言-动作(VLA)模型在复杂场景下的鲁棒性与泛化能力。
当前焦点在于如何结合视觉、语言和几何先验,使模型在少样本、遮挡或指令模糊的情况下仍能可靠操作。未来观察点包括:是否存在统一的框架整合重标注、遮挡推理与几何建模,以及这些方法能否迁移到真实机器人系统。
LIBERO 是机器人操作领域常用的基准数据集和仿真环境,近期多个工作围绕其任务展开。当前趋势聚焦于提升视觉-语言-动作(VLA)模型在复杂场景下的鲁棒性与泛化能力。
当前焦点在于如何结合视觉、语言和几何先验,使模型在少样本、遮挡或指令模糊的情况下仍能可靠操作。未来观察点包括:是否存在统一的框架整合重标注、遮挡推理与几何建模,以及这些方法能否迁移到真实机器人系统。