AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:GROW^2×
6月30日
13:53
13:53arXiv cs.AI@Yuhong Deng, Yuyao Liu, David Hsu
GROW^2提出一种层次化功能定位方法,将物体部件作为抽象层分割语义和几何过程。语义层利用VLM(如GPT-4V)分析任务指令并选择合适工具及关键部件;几何层通过视觉基础模型(如SAM)从单张RGB-D图像定位精确3D区域。在功能预测基准上,GROW^2优于现有基线方法,并实现对开集物体的零样本泛化。仿真和真实机器人工具使用实验均验证了其有效性,例如用盘子代替刀切蛋糕。
论文GROW^2VLM视觉基础模型机器人工具使用

推荐理由:这篇论文教机器人像人类一样用盘子切蛋糕,不受工具原始功能限制。用VLM选工具、SAM定位,零样本效果比现有方法好。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
精选全部日报登录