arXiv cs.LG@Elle Miller, Jayaram Reddy, Ayush Deshmukh, Trevor McInroe, David Abel, Oisin Mac Aodha, Sethu Vijayakumar精选72机器人触觉强化学习(RL)研究因碎片化和过度关注饱和的定向任务而受阻。roto 2.0 是一个 GPU 并行化的基准测试,覆盖四种不同机器人形态(16-24 自由度),专注于仅依赖本体感觉和触觉的“盲”操作,无需状态信息或知识蒸馏。其盲代理在 10 秒内完成 13 次 Baoding 球旋转,速度比当前最先进水平快一个数量级。通过开源环境和调优基线,该工作降低了入门门槛,让研究者能聚焦核心算法挑战。论文触觉感知强化学习机器人操作基准测试GPU并行推荐理由:触觉 RL 终于有了标准化的 GPU 并行基准,做机器人操作和强化学习的团队可以直接用 roto 2.0 测试算法,不用再花时间调环境——盲操速度提升 10 倍的结果值得点开看看。
arXiv cs.AI@Riley Zilka, Sergey Khlynovskiy, Allie Wang, Martin Jagersand精选41HITL-D 是一种结合人类操作与扩散模型的新型共享控制框架,专门针对多步骤、插入和精细操作任务。它通过场景点云和末端执行器笛卡尔位置,自主更新末端执行器方向,减少操纵杆控制轴数,降低操作者认知负荷。12 人用户研究表明,相比传统遥操作,HITL-D 将任务完成时间平均缩短 40%,感知工作负荷降低 37%,并在独立性、直观性和信心等主观评分上显著提升。该工作首次将扩散策略引入人机共享控制,为复杂操作任务的人机协作提供了新范式。论文扩散模型人机协同共享控制遥操作机器人操作推荐理由:做机器人遥操作或人机协作研究的团队,HITL-D 用扩散模型把操作者的认知负担砍掉近四成,值得在精细操作场景里试试。