精选理由
小米汽车把世界模型的两条路线拧成一股绳,解决了重建缺想象、生成易漂移的行业难题。做自动驾驶感知或仿真的团队,建议看看他们的论文和技术主页,或许能启发新的技术路径。
小米汽车发布了全新的世界模型框架 Xiaomi Auto World Model,首次将三维重建与视频生成深度耦合,打破了行业长期将两者独立的技术路线。该框架通过重建提供几何锚点、生成填补未观测场景,实现了高稳定性、高一致性和高真实性,在 Waymo、nuScenes 等主流基准测试中全面取得 SOTA。目前该模型已在小米汽车的合成数据生成、仿真测试和智能座舱辅助驾驶学堂三大场景落地,交付了超过 10 万 clips 高质量合成数据。这一技术路径有望推动辅助驾驶从“场景感知”向“认知推演”的高阶形态跃迁。
AI 翻译 · 中文
小米汽车发布了全新的世界模型框架 Xiaomi Auto World Model,首次将三维重建与视频生成深度耦合,打破了行业长期将两者独立的技术路线。该框架通过重建提供几何锚点、生成填补未观测场景,实现了高稳定性、高一致性和高真实性,在 Waymo、nuScenes 等主流基准测试中全面取得 SOTA。目前该模型已在小米汽车的合成数据生成、仿真测试和智能座舱辅助驾驶学堂三大场景落地,交付了超过 10 万 clips 高质量合成数据。这一技术路径有望推动辅助驾驶从“场景感知”向“认知推演”的高阶形态跃迁。
IT之家 5 月 26 日消息,小米技术官方宣布,小米汽车今日发布 Xiaomi Auto World Model 全新框架,为业界辅助驾驶世界模型提供了新的框架路径,推动行业从“场景感知”向“认知推演、场景进化”的高阶形态跃迁。 据介绍,这是小米首次将三维重建与视频生成深度耦合的一体化架构,以「重建锚定几何、生成填补想象」的新范式,打破行业长期采用的重建、生成独立拆分路线。 在 Waymo、nuScenes 等主流基准测试中全面取得 …