AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:操作技能×
6月24日
11:58
11:58arXiv cs.LG@Maggie Wang, Lars Osterberg, Stephen Tian, Ola Shorinwa, Jiajun Wu, Mac Schwager
InSight框架通过将VLA模型在原始动作层面变得可操控,从而解锁自主技能获取能力。该框架包含自动分割管道,利用VLM计划分解和末端执行器姿态将演示分割成带标签的原始动作,以及VLM引导的数据飞轮,自动识别缺失原始动作并尝试演示。在模拟和真实世界操作任务中(包括方块翻转、抽屉关闭、清扫、扭转、倒水)评估,无需任何人工演示即可学习这些技能。学到的原始动作可组合执行新颖的长周期任务,无需额外人工演示。
论文InSightVLA操作技能自主学习机器人

推荐理由:这篇论文提出了InSight框架,让机器人通过VLA模型自己学新技能,不用人教,就能搞定方块翻转、倒水这些操作,很有实用性。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
精选全部日报登录