vla策略·general

VLA策略

别名
首次出现
2026-05-22
最近出现
2026-06-09
累计提及
3
§ 01综述

VLA策略(视觉-语言-动作策略)是一种结合视觉、语言和动作模态的机器人学习范式,使机器人能够通过自然语言指令和视觉感知来执行复杂操作。该领域近期在模型压缩、故障恢复、行为可解释性和训练加速方面取得显著进展。

VLA策略近期进展

  • 故障恢复能力提升:ReCoVLA利用视觉语言模型(VLM)引导奖励编译,使VLA策略能在执行失败后自主调整动作,显著增强鲁棒性。ReCoVLA:VLM引导奖励编译,提升VLA策略故障恢复能力
  • 行为级可解释性:事件锚定稀疏自编码器(Event-Anchored Sparse Autoencoders)为VLA策略提供可解释的行为表示,揭示中间决策过程,有助于理解模型内部机制。事件锚定稀疏自编码器:为VLA策略提供行为级可解释性
  • 模型压缩与蒸馏:VLA-AD通过离线语义引导蒸馏,将7B参数的VLA教师模型压缩44倍至158M学生模型,在保持高性能的同时大幅降低计算需求。VLA-AD:离线语义引导蒸馏,将7B VLA教师压缩44倍至158M学生模型
  • 训练加速:概率性分块掩码(Probabilistic Chunking Mask)方法将VLA策略的强化学习训练速度提升2.38倍,通过动态分组动作块减少探索空间。PCM:概率性分块掩码加速VLA强化学习2.38倍
  • 当前焦点与观察点

    当前VLA策略的研究焦点集中在提升实用性与可解释性:一是通过蒸馏和加速技术降低模型部署成本,推动VLA策略从实验室走向真实机器人;二是通过稀疏编码和奖励编译增强模型的故障恢复与决策透明度,以应对复杂动态环境。然而,VLA策略的泛化能力、跨任务迁移以及长时序动作规划仍是未完全解决的挑战。随着模型压缩方法的成熟,未来VLA策略有望在低算力设备上实现实时控制,同时可解释性的突破将增强人机信任与调试效率。
    § 02相关报道04 条在档
    1. 01
      ReCoVLA:VLM引导奖励编译,提升VLA策略故障恢复能力
      arXiv cs.AI
    2. 02
      事件锚定稀疏自编码器:为VLA策略提供行为级可解释性
      arXiv cs.AI
    3. 03
      VLA-AD:离线语义引导蒸馏,将7B VLA教师压缩44倍至158M学生模型
      arXiv cs.AI
    4. 04
      PCM:概率性分块掩码加速VLA强化学习2.38倍
      arXiv cs.LG
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/VLA%E7%AD%96%E7%95%A5