精选理由
这篇论文搞了个EvolveNav,让机器人自己从失败中学习,零样本导航成功率直接涨了10%,而且没走那么多冤枉路。
EvolveNav 提出了一种自演化框架,用于零样本物体目标导航,无需预先训练。该方法通过构建代理规则记忆,从过往轨迹中提取可操作知识,并采用基于上置信界(UCB)的检索策略平衡语义相关性和历史成功率。还引入了记忆引导的前置反思模块,在行动前预测潜在结果,减少低效探索。实验表明,EvolveNav 在多个基准上超越现有零样本基线,成功率提升 10.1%,同时减少了不必要的步骤。
AI 翻译 · 中文
EvolveNav 提出了一种自演化框架,用于零样本物体目标导航,无需预先训练。该方法通过构建代理规则记忆,从过往轨迹中提取可操作知识,并采用基于上置信界(UCB)的检索策略平衡语义相关性和历史成功率。还引入了记忆引导的前置反思模块,在行动前预测潜在结果,减少低效探索。实验表明,EvolveNav 在多个基准上超越现有零样本基线,成功率提升 10.1%,同时减少了不必要的步骤。
Zero-Shot Object-Goal Navigation (ZS-OGN) requires embodied agents to explore and locate target objects without any prior training. To this end, recent methods leverage foundation models. But they typically rely on stati…