全部 AI 动态 · AI 热点

6月18日

11:40

11:40

berryxia@berryxia

在YC访谈中，李飞飞指出世界模型需要超越平面像素和语言，捕捉3D结构和空间智能。Aether AI的因果世界模型进一步补全推理能力，使模型从学习相关性进化到理解因果关系。两条路线（3D空间表征+因果推理）结合，有望推动具身智能从模仿到思考的范式转变。

行业李飞飞空间智能因果世界模型世界模型具身智能

推荐理由：李飞飞直接点名空间智能是下一波重点，还和Aether AI的因果世界模型对上了线。看懂物理世界，AI才能真变聪明。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

05:18

05:18

a16z@a16z

World Labs CEO、AI 学者李飞飞在 Bloomberg Tech 活动上呼吁，AI 必须推动 K-16 教育体系变革。她指出，当 AI 能比普通人更好回答标准化试题时，问题不在于人类不行，而在于评估方式过时。她强调人类资本是世界上最宝贵的资源，教育应转向赋能学生使用 AI 工具，培养他们引领 AI、正确使用 AI 的能力。李飞飞鼓励孩子们不要害怕 AI，而要发挥人类能动性，用 AI 创造前所未有的影响力。

行业 AI 教育李飞飞教育评估人类能动性 K-16 学习

推荐理由：李飞飞直指 AI 时代教育的核心矛盾——标准化考试已失效，做教育决策、课程设计或关心孩子未来的家长/老师，值得听听这位 AI 领袖的变革思路。

05:01

05:01

a16z@a16z

精选

World Labs CEO 李飞飞在 Bloomberg Tech Live 上指出“世界模型”一词已被过度使用，并澄清了当前空间智能领域对世界模型的三种定义。第一类是渲染器，负责生成精美像素；第二类是规划器，主要用于机器人和机器决策；第三类是模拟器，她认为这是三者中的关键，既能成为渲染器也能成为规划器，是解锁空间智能的核心路径。World Labs 正专注于模拟器这一层的研发。

AI模型世界模型空间智能李飞飞 World Labs 模拟器

推荐理由：李飞飞把混乱的“世界模型”概念拆清楚了，做空间智能、机器人或 3D 生成的研究者值得一看，能帮你快速对齐行业术语和方向。

6月4日

21:46

21:46

rohanpaul_ai@rohanpaul_ai

李飞飞指出，大语言模型擅长处理文本模式，能描述房间，但无法理解椅子移动、玻璃破碎或阳光变化时房间如何改变。她强调，世界模型旨在学习视觉背后的隐藏结构，能预测相机未捕捉的视角、模拟物体行为，并支持实体智能体在真实或虚拟环境中行动。这种模型需要共同理解空间、因果和后果，是AI从文本走向物理世界的关键一步。

论文世界模型李飞飞物理智能因果推理空间理解

推荐理由：李飞飞点出了LLM的物理盲区，做机器人、自动驾驶或空间计算的团队，看完会重新思考模型架构。

13:46

13:46

AI Will@FinanceYF5

精选

李飞飞和 World Labs 团队指出，当前被统称为「世界模型」的技术实际上包含三种截然不同的方向：视频模型、游戏生成和物理引擎。它们虽然共享同一名称，但在目标、方法和应用上差异巨大。视频模型侧重预测像素序列，游戏生成关注交互式环境构建，物理引擎则强调真实物理规律模拟。这一澄清有助于避免概念混淆，推动各方向更精准的研究与落地。

AI模型世界模型视频模型游戏生成物理引擎李飞飞

推荐理由：做 AI 研究或产品的人经常被「世界模型」这个词搞混——李飞飞帮你拆清楚了，看完能少走弯路，建议点开。

10:20

10:20

berryxia@berryxia

76°

李飞飞在最新文章中系统阐述了世界模型的三种核心功能：渲染器（输出像素，如文生视频模型）、模拟器（输出状态，需物理准确）和规划器（输出动作，闭合感知-行动循环）。她指出模拟器是最关键但最被低估的一环，连接渲染与规划，是实现可靠真实世界应用的核心。World Labs 的 Marble 项目展示了从多模态提示生成可探索 3D 环境的能力，同时输出视觉和物理数据。文章强调语言模型擅长文本，但物理世界需要空间智能，统一世界模型是 AI 的下一个前沿。

AI模型世界模型空间智能李飞飞 World Labs 模拟器

推荐理由：李飞飞把被滥用的「世界模型」概念理清了，做计算机视觉、机器人或生成式 AI 的开发者能直接对照自己的研究方向找到定位，建议点开看完整分类法。

06:42

06:42

Justine Moore@venturetwins

AI 领域术语“世界模型”被过度使用，令人困惑。李飞飞博士在一篇文章中将其拆解为三个核心功能，并预测了未来发展方向。该文章旨在澄清概念，帮助从业者理解世界模型的实际作用。文章还提供了对世界模型未来趋势的洞察，对于关注 AI 前沿研究的读者具有参考价值。

AI模型世界模型李飞飞 AI 术语概念澄清未来预测

推荐理由：李飞飞把最混乱的 AI 术语讲清楚了，做 AI 研究或产品的人看完能少走弯路，建议点开。

5月30日

01:21

01:21

Fei-Fei Li@drfeifei

斯坦福大学教授李飞飞团队推出GPIC（Giant Permissive Image Corpus），这是一个专为大规模生成模型设计的视觉生成基准数据集。该数据集包含1亿对VLM标注的图文训练对和100万对基准测试对，总计约28万亿像素。所有数据均完全开放用于研究和商业用途，并集中托管。GPIC旨在解决现有数据集在规模、许可和标注质量上的不足，为视觉生成领域提供标准化评估平台。

论文视觉生成基准数据集 GPIC 李飞飞开放许可

推荐理由：做视觉生成模型的研究者终于有了一个大规模、开放许可的标准化基准，可以直接用来训练和评估模型，省去自己收集和清洗数据的麻烦。

5月14日

13:37

13:37

Fei-Fei Li@drfeifei

斯坦福大学李飞飞教授在推特上分享，她主讲的计算机视觉课程 CS231n 已进入第 11 年。每年春季学期的第一堂课，她都会询问学生来自哪个学院。今年，越来越多的学生举手表示来自斯坦福全部七个学院，包括工程学院、医学院、人文科学学院、商学院、法学院、教育学院和多尔可持续发展学院。李飞飞认为，AI 真正成为了一项横向技术，能够激发不同背景和学科学生的热情。

行业 AI 教育跨学科斯坦福 CS231n 李飞飞

推荐理由：李飞飞用 11 年的课堂数据证明了 AI 的跨学科渗透力，做 AI 教育或关注技术普及的读者会从中看到趋势——AI 不再是计算机系的专属，值得一读。