World Labs 是李飞飞创立的一家专注于空间智能的 AI 公司,旨在构建能够理解、生成和与三维世界交互的“世界模型”。近期,李飞飞在 a16z 的讨论中澄清了世界模型这一热词,将其划分为三类:渲染器(Renderers),即被动生成视觉场景的模型;规划器(Planners),能够为具体任务进行路径或操作规划;以及模拟器(Simulators),能预测物理世界动态并支持反事实推理。她强调当前多数模型仅停留在渲染器阶段,而真正的智能需要走向后两者。 李飞飞指出媒体滥用了“世界模型”一词,并给出了上述三分法,明确了该领域的技术层次与未来方向((李飞飞:世界模型被过度使用,分三类——渲染器、规划器、模拟器))。 她进一步解释,规划器与模拟器的核心差异在于是否具备因果结构和时间一致性,例如模拟器能像物理引擎一样给出可编辑的未来状态((李飞飞论世界模型三种形态:渲染器、模拟器、规划器))。 在应用层面,World Labs 的技术已可仅凭单张图片生成可探索的 3D 世界,并整合生成式 3D 资产与语音,展现出从静态渲染向动态场景理解的跨越((输入图片生成3D世界:World Labs + Hunyuan 3D + ElevenLabs))。 当前焦点在于业界对“世界模型”概念的争夺与定义权的厘清。李飞飞的分类法有助于引导研究从视觉渲染跳向具备物理因果推理的模拟器,而 World Labs 的产品进展则表明其正将这一理念落地。未来需观察规划器/模拟器在机器人、自动驾驶等领域的验证,以及该分类法能否成为行业共识。