精选理由
E-TTS团队搞了个新框架,不用重新训练就把机器人操作成功率在模拟中提33%,真实场景提26%,挺实用的。
E-TTS是一个模块化、即插即用的具身测试时缩放框架,通过历史感知的迭代精炼和视觉语言验证器,统一了机器人操作中的推理和动作缩放。它采用推理-动作联合采样和成对评分,并引入历史缓冲区存储上下文,用于推理和动作验证器评估候选。与常规开环TTS不同,E-TTS在采样中引入反馈生成,形成闭环迭代精炼机制。实验在4个基准、6个环境、3个实体和4个基础VLA模型上进行,模拟场景提升33.14%,真实场景提升26.62%,无需额外数据收集或重新训练。
AI 翻译 · 中文
E-TTS是一个模块化、即插即用的具身测试时缩放框架,通过历史感知的迭代精炼和视觉语言验证器,统一了机器人操作中的推理和动作缩放。它采用推理-动作联合采样和成对评分,并引入历史缓冲区存储上下文,用于推理和动作验证器评估候选。与常规开环TTS不同,E-TTS在采样中引入反馈生成,形成闭环迭代精炼机制。实验在4个基准、6个环境、3个实体和4个基础VLA模型上进行,模拟场景提升33.14%,真实场景提升26.62%,无需额外数据收集或重新训练。
Recently, a few works have made early attempts to study test-time scaling for embodied tasks. However, two major challenges remain unsolved: (1) reasoning can effectively improve the performance of the policy, but its sc…