AI模型精选73°

Qwen-RobotSuite:三个具身AI模型覆盖操作、世界建模与导航

Meet Qwen-RobotSuite: Three Embodied AI Models for VLA Manipulation, Video World Modeling, and Navigation

精选理由

一口气发了三个模型,从操作到导航都管了,全用自家Qwen3.5和Qwen3-VL,做机器人研究的可以看看。

AI 摘要

Qwen团队推出Qwen-RobotSuite,包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型,用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型,提供2B、4B和8B三种参数量。

图片来源 · marktechpost
AI 翻译 · 中文

Qwen团队推出Qwen-RobotSuite,包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型,用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型,提供2B、4B和8B三种参数量。

marktechpostWe break down Qwen-RobotSuite, the Qwen team's three new embodied AI models. We cover RobotManip, a Vision-Language-Action model built on Qwen3.5-4B for manipulation. We cover RobotWorld, a language-conditioned video wor