LIBERO

§ 01综述

LIBERO 是机器人操作领域常用的基准数据集和仿真环境，近期多个工作围绕其任务展开。当前趋势聚焦于提升视觉-语言-动作（VLA）模型在复杂场景下的鲁棒性与泛化能力。

TREAD 提出利用视觉语言模型（VLM）重标注 LIBERO 数据集，通过生成更细致的任务指令来增强模型对指令变体的跟随能力，从而提升在 LIBERO 任务上的鲁棒性 (TREAD：用VLM重标注机器人数据，提升指令跟随鲁棒性)。

LIBERO-Occ 则关注场景遮挡问题，通过引入“视角想象”机制，使 VLA 模型能够推断被遮挡物体的位姿，在 LIBERO 的遮挡场景下显著提升成功率 (LIBERO-Occ：通过视角想象提升VLA模型在场景遮挡下的鲁棒性)。

GEAR-VLA 探索几何感知的动作表征，将几何信息（如物体姿态）显式融入动作空间，并在 LIBERO 基准上进行验证，实现了更好的任务泛化 (GEAR-VLA：几何感知动作表征实现机器人操作泛化)。

当前焦点在于如何结合视觉、语言和几何先验，使模型在少样本、遮挡或指令模糊的情况下仍能可靠操作。未来观察点包括：是否存在统一的框架整合重标注、遮挡推理与几何建模，以及这些方法能否迁移到真实机器人系统。

§ 02相关报道03 条在档

§ 03邻近话题