零样本迁移

§ 01综述

零样本迁移（zero-shot transfer）是机器学习和人工智能中一个极具挑战性的能力，它要求模型在没有见过新任务或新环境任何样本的情况下，直接运用已有的知识完成泛化。这一概念与迁移学习、元学习密切相关，但其零样本约束使其成为衡量智能体泛化能力的标杆。近年来，随着大模型和组合式方法的发展，零样本迁移在机器人学习等领域取得了显著突破，但也面临着可靠性、安全性等实际部署难题。

零样本迁移近期进展

ReCoVLA：VLM引导奖励编译，提升VLA策略故障恢复能力：这项研究利用视觉语言模型（VLM）的推理能力，为机器人视觉-语言-行动（VLA）策略在零样本情况下提供奖励指导。当机器人执行任务失败时，VLM能自动评估并编译新的奖励函数，使策略无需额外训练即可从错误中恢复正常。该方法展示了零样本迁移在动态环境中的实用潜力。原文标题

World-Task Factorization 实现机器人学习零样本泛化：该工作提出将世界模型与任务表征分解，使得机器人能通过对世界结构和任务目标的独立理解，在不同环境和任务间零样本迁移。例如，在仿真中学会堆叠方块，无需任何真实数据即可在真实机器人上完成相同任务。这为跨域零样本迁移提供了新的框架。原文标题

迁移学习在定制赛车环境中的应用：模型方法优于无模型：对比了在定制赛车模拟环境中，基于模型的强化学习方法与无模型方法在零样本迁移到新赛道时的表现。结果显示，由于模型方法能捕获环境动态的因果关系，它们能更有效地将控制知识从训练赛道迁移到未见赛道，而无模型方法则容易过拟合。原文标题

当前焦点与观察点

当前零样本迁移的研究焦点集中在如何将外部知识（如语言模型）与机器人本体协同，以及如何通过结构化解耦提升迁移的鲁棒性。另一方面，零样本迁移的可靠性评估仍缺乏标准，尤其是在安全关键的领域（如自动驾驶、医疗机器人）。此外，虽然组合式方法展示了潜力，但其对知识组件质量的依赖可能导致不可预测的失败。未来，零样本迁移有望与基础模型深度融合，但需解决因果推理和常识对齐等核心挑战。

§ 02相关报道04 条在档

§ 03邻近话题