AI模型精选72°

Qwen-RobotWorld将自然语言作为统一动作接口,支持20+具身类型与500+动作类别

By treating natural language as a universal action interface,Qwen-RobotWorld bridges the gap betwee...

精选理由

Qwen把自然语言当遥控器,一个模型搞定机器臂、自动驾驶、无人机等20多种动作,还赢了多个基准,挺有意思。

AI 摘要

Qwen-RobotWorld由阿里巴巴Qwen团队发布,将自然语言视为通用动作接口,统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库(860万视频-文本对、超2亿帧)上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。

AI 翻译 · 中文

Qwen-RobotWorld由阿里巴巴Qwen团队发布,将自然语言视为通用动作接口,统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库(860万视频-文本对、超2亿帧)上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。

阿里通义 QwenBy treating natural language as a universal action interface,Qwen-RobotWorld bridges the gap between general video generation models and domain-specific embodied models — this converts end-effector poses, steering comman