李飞飞论世界模型三种形态：渲染器、模拟器、规划器

精选理由

李飞飞把被滥用的「世界模型」概念理清了，做计算机视觉、机器人或生成式 AI 的开发者能直接对照自己的研究方向找到定位，建议点开看完整分类法。

AI 摘要

李飞飞在最新文章中系统阐述了世界模型的三种核心功能：渲染器（输出像素，如文生视频模型）、模拟器（输出状态，需物理准确）和规划器（输出动作，闭合感知-行动循环）。她指出模拟器是最关键但最被低估的一环，连接渲染与规划，是实现可靠真实世界应用的核心。World Labs 的 Marble 项目展示了从多模态提示生成可探索 3D 环境的能力，同时输出视觉和物理数据。文章强调语言模型擅长文本，但物理世界需要空间智能，统一世界模型是 AI 的下一个前沿。

AI 翻译 · 中文

berryxia刚刚看到李飞飞最新的发的文章，虽然没有了语言墙，但是还是喜欢自己翻译看一下完整的内容。👇🏻 “世界不是由词语构成的”：Fei-Fei Li 论世界模型的三种形态与空间智能！（译） > “The world is everything that is the case.” --路德维希·维特根斯坦一、世界不是由词语构成的。语言模型在文本、概念和推…

查看原推