11:34IT之家(博客/媒体)76°小米汽车发布了全新的世界模型框架 Xiaomi Auto World Model,首次将三维重建与视频生成深度耦合,打破了行业长期将两者独立的技术路线。该框架通过重建提供几何锚点、生成填补未观测场景,实现了高稳定性、高一致性和高真实性,在 Waymo、nuScenes 等主流基准测试中全面取得 SOTA。目前该模型已在小米汽车的合成数据生成、仿真测试和智能座舱辅助驾驶学堂三大场景落地,交付了超过 10 万 clips 高质量合成数据。这一技术路径有望推动辅助驾驶从“场景感知”向“认知推演”的高阶形态跃迁。AI产品世界模型自动驾驶三维重建视频生成小米汽车推荐理由:小米汽车把世界模型的两条路线拧成一股绳,解决了重建缺想象、生成易漂移的行业难题。做自动驾驶感知或仿真的团队,建议看看他们的论文和技术主页,或许能启发新的技术路径。原文