AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:人形机器人×
6月23日
13:18
13:18arXiv cs.AI@Sikai Li, Shuning Li, Zhenyu Wei, Yunchao Yao, Chenran Li, Mingyu Ding
CoorDex是一个学习管线,将高维全身和灵巧手控制转换为协调的潜在残差控制,使Unitree G1人形机器人搭配20-DoF WUJI手能在移动中执行灵巧操作。它从模拟全身和手部演示训练特权运动跟踪教师,蒸馏为潜在先验,再用残差强化学习训练协调策略。该方法实现了非停止的瓶子抓取搬运、移动中打开冰箱门和立方体旋转。消融实验表明,联合空间PPO、联合空间手控制和整体潜在预测在同一奖励预算下均失败。
AI模型CoorDexUnitree G1人形机器人灵巧操作全身控制

推荐理由:CoorDex让人形机器人在行走时用灵巧手完成开冰箱、抓瓶子的连续操作,不再需要走走停停,和之前的笨拙模式完全不一样。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
12:16
12:16arXiv cs.LG@Wei Xiao, Weiliang Tang, Yuying Ge, Hui Zhou, Yao Mu, Li Zhang, Yixiao Ge
ROVE 是一个用于人形机器人视觉-语言-动作(VLA)模型后训练的强化学习框架,能够应对不完美的人类干预数据。它引入人类在环流水线收集部署与干预数据,并使用乐观价值估计(OVE)从混合质量轨迹中筛选高价值行为。ROVE 还利用跨实体人类经验视频为长尾失败与恢复模式提供丰富监督,引导 VLA 聚焦于高价值行为。在真实世界的接触丰富且精细的人形操作任务中,ROVE 超越了经验学习基线,并在多轮部署-干预迭代中持续提升。
AI模型ROVE人形机器人强化学习VLA模型操作

推荐理由:人形机器人操作新方法ROVE,用强化学习从糟糕的人类演示中挑出好动作,真实任务效果比基线好。
原文
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
11:30
11:30arXiv cs.AI@Yichao Zhong, Yidan Lu, Yuhang Lu, Tianyang Tang, Haoguang Mai, Yixuan Pan, Tianyu Li, Li Chen, Jingbo Wang, Zhongyu Li, Peng Lu, Hongyang Li
72°
RoboNaldo 是一种三阶段运动引导课程强化学习框架,旨在解决人形机器人足球射门中的全身稳定性、高冲击力交互和精准度问题。它先用单一人踢参考动作学习稳定踢球先验,再适应固定球位置的任意球场景,最后扩展到移动球射门。在仿真中,RoboNaldo 的任意球射门误差比基线低 48.6%,射门速度提升 2.96 倍。在 Unitree G1 机器人上,从 3 米外射门平均误差为 0.73 米(任意球)和 0.86 米(移动球),触球后球速达 13.10 米/秒,达到职业球员射门速度的 59-71%。该工作为高动态人形机器人运动控制提供了新范式。
论文人形机器人强化学习课程学习运动控制Unitree G1

推荐理由:做足式机器人运动控制或强化学习的团队,RoboNaldo 的课程学习思路能直接借鉴——用单条参考动作引导复杂技能学习,解决了从仿真到真实部署的精度和速度难题,值得点开看方法细节。
原文
6月5日
12:20
12:20arXiv cs.AI@Lizhi Yang, Junheng Li, Nehar Poddar, Yiling Hou, Gio Huh, Robert Griffin, Georgia Gkioxari, Aaron Ames
精选
HANDOFF 提出了一种紧凑、直观的接口,用于人形机器人的任务规划与全身控制之间的连接。该接口通过多教师 KL 蒸馏和上下文条件门控机制,将三个互补专家(全身运动跟踪、行走、跌倒恢复)蒸馏成一个混合专家学生模型。在 Unitree G1 机器人上,HANDOFF 实现了与最先进方法相当的行走速度跟踪,并提供了最大的鲁棒操作工作空间之一。此外,通过 VLM 驱动的智能体规划器,无需任务特定数据或控制器微调,即可实现自然语言驱动的任务执行。这项工作为人形机器人在现实世界中的部署提供了更高效、更通用的控制方案。
论文人形机器人全身控制知识蒸馏混合专家模型Unitree G1

推荐理由:人形机器人开发者终于有了一个更直观、通用的控制接口——HANDOFF 通过蒸馏多个专家模型,让机器人能同时做好行走、操作和跌倒恢复,做机器人全身控制的团队可以直接参考其方法。
原文
5月25日
11:19
11:19arXiv cs.AI@Ming Yang, Tao Yu, Feng Li, Hua Chen
精选
全身跟踪(WBT)模型是人形机器人模仿多样动作的关键基础,但从头训练需要大量数据和计算资源。Any2Any 提出一种新范式,通过运动学对齐和轻量级参数高效微调(PEFT),将预训练的 WBT 模型快速迁移到新的人形机器人本体上。实验表明,仅需 1% 的计算和数据量,Any2Any 就能将基于 Unitree G1 预训练的 Sonic 模型成功迁移到 LimX Oli 和 LimX Luna 上,性能与从头训练相当甚至更优。这为快速部署人形机器人全身控制提供了可扩展的路径。
论文人形机器人全身跟踪迁移学习参数高效微调Any2Any

推荐理由:人形机器人开发者终于有了低成本复用预训练模型的方法——Any2Any 用 1% 的数据和算力就能迁移全身跟踪能力,做机器人部署的团队可以直接参考。
原文
精选全部日报登录