雷军谈小米自动驾驶模型 Xiaomi OneVL:率先统一 VLA 与世界模型

雷军谈小米自动驾驶模型 Xiaomi OneVL:业内率先通过潜空间推理将 VLA、世界模型统一到一套框架

精选理由

小米把 VLA 和世界模型统一到一套框架,解决了自动驾驶多模型协同的痛点,做自动驾驶或具身智能的开发者可以直接用开源代码试试,性能还刷新了基准。

AI 摘要

小米发布并开源了 Xiaomi OneVL,一个一步式潜空间语言视觉推理框架。雷军称,该模型在业内率先通过潜空间推理将 VLA(视觉语言动作模型)和世界模型统一到同一框架中。在推理和规划等主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。该模型在精度上超越显式 CoT,速度上对齐“仅答案”预测的潜空间 CoT 方案。小米已将模型权重和训练、推理代码全面开源,邀请全球开发者探索自动驾驶大模型的可能性。

AI 翻译 · 中文

小米发布并开源了 Xiaomi OneVL,一个一步式潜空间语言视觉推理框架。雷军称,该模型在业内率先通过潜空间推理将 VLA(视觉语言动作模型)和世界模型统一到同一框架中。在推理和规划等主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。该模型在精度上超越显式 CoT,速度上对齐“仅答案”预测的潜空间 CoT 方案。小米已将模型权重和训练、推理代码全面开源,邀请全球开发者探索自动驾驶大模型的可能性。

IT之家IT之家 5 月 14 日消息,小米技术昨日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。 小米创办人、董事长兼 CEO 雷军昨晚发文谈及了小米自动驾驶模型 Xiaomi OneVL。他表示, Xiaomi OneVL 在业内率先通过潜空间推理,将 VLA、世界模型统一到同一套框架中 。 雷军还提到,在推理、规划等多个主流基准上, Xiaomi OneVL 全面刷新了潜在推理方法的性能上限 。模型与代码全面开源