E-TTS:一种具身测试时缩放框架,用于机器人操作

E-TTS: A New Embodied Test-Time Scaling Framework for Robotic Manipulation

精选理由

E-TTS团队搞了个新框架,不用重新训练就把机器人操作成功率在模拟中提33%,真实场景提26%,挺实用的。

AI 摘要

E-TTS是一个模块化、即插即用的具身测试时缩放框架,通过历史感知的迭代精炼和视觉语言验证器,统一了机器人操作中的推理和动作缩放。它采用推理-动作联合采样和成对评分,并引入历史缓冲区存储上下文,用于推理和动作验证器评估候选。与常规开环TTS不同,E-TTS在采样中引入反馈生成,形成闭环迭代精炼机制。实验在4个基准、6个环境、3个实体和4个基础VLA模型上进行,模拟场景提升33.14%,真实场景提升26.62%,无需额外数据收集或重新训练。

AI 翻译 · 中文

E-TTS是一个模块化、即插即用的具身测试时缩放框架,通过历史感知的迭代精炼和视觉语言验证器,统一了机器人操作中的推理和动作缩放。它采用推理-动作联合采样和成对评分,并引入历史缓冲区存储上下文,用于推理和动作验证器评估候选。与常规开环TTS不同,E-TTS在采样中引入反馈生成,形成闭环迭代精炼机制。实验在4个基准、6个环境、3个实体和4个基础VLA模型上进行,模拟场景提升33.14%,真实场景提升26.62%,无需额外数据收集或重新训练。

arXiv cs.AIRecently, a few works have made early attempts to study test-time scaling for embodied tasks. However, two major challenges remain unsolved: (1) reasoning can effectively improve the performance of the policy, but its sc