全部 AI 动态 · AI 热点

6月22日

10:48

10:48

Pandaily@contact@pandaily.com (Pandaily)

ByteDance Seed与学术合作伙伴提出SpatialTree，这是一个分层框架，旨在重新定义多模态大模型（MLLM）对空间的理解与推理能力。该工作已被计算机视觉顶级会议CVPR 2026接收。SpatialTree通过层级结构显著提升MLLM在空间任务上的表现。

AI模型 SpatialTree ByteDance Seed CVPR 2026 多模态空间智能

推荐理由：字节跳动Seed搞了个SpatialTree框架，专门提升多模态模型的空间推理能力，还被CVPR 2026接受了，值得一看。

6月20日

23:55

23:55

AK@_akhaliq

研究人员发布了S-Agent，一个通过空间工具使用来增强空间推理能力的模型。S-Agent在虚拟环境中学习操作和使用空间工具，如旋转、移动物体等，以解决空间任务。该方法在空间智能基准测试中展现了显著的推理能力提升。

AI模型 S-Agent 推理模型空间智能智能体

推荐理由：S-Agent教AI通过操作空间工具来推理空间关系，跟传统只靠视觉的模型不一样，值得关注。

6月18日

11:40

11:40

berryxia@berryxia

在YC访谈中，李飞飞指出世界模型需要超越平面像素和语言，捕捉3D结构和空间智能。Aether AI的因果世界模型进一步补全推理能力，使模型从学习相关性进化到理解因果关系。两条路线（3D空间表征+因果推理）结合，有望推动具身智能从模仿到思考的范式转变。

行业李飞飞空间智能因果世界模型世界模型具身智能

推荐理由：李飞飞直接点名空间智能是下一波重点，还和Aether AI的因果世界模型对上了线。看懂物理世界，AI才能真变聪明。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

05:01

05:01

a16z@a16z

精选

World Labs CEO 李飞飞在 Bloomberg Tech Live 上指出“世界模型”一词已被过度使用，并澄清了当前空间智能领域对世界模型的三种定义。第一类是渲染器，负责生成精美像素；第二类是规划器，主要用于机器人和机器决策；第三类是模拟器，她认为这是三者中的关键，既能成为渲染器也能成为规划器，是解锁空间智能的核心路径。World Labs 正专注于模拟器这一层的研发。

AI模型世界模型空间智能李飞飞 World Labs 模拟器

推荐理由：李飞飞把混乱的“世界模型”概念拆清楚了，做空间智能、机器人或 3D 生成的研究者值得一看，能帮你快速对齐行业术语和方向。

6月4日

10:20

10:20

berryxia@berryxia

76°

李飞飞在最新文章中系统阐述了世界模型的三种核心功能：渲染器（输出像素，如文生视频模型）、模拟器（输出状态，需物理准确）和规划器（输出动作，闭合感知-行动循环）。她指出模拟器是最关键但最被低估的一环，连接渲染与规划，是实现可靠真实世界应用的核心。World Labs 的 Marble 项目展示了从多模态提示生成可探索 3D 环境的能力，同时输出视觉和物理数据。文章强调语言模型擅长文本，但物理世界需要空间智能，统一世界模型是 AI 的下一个前沿。

AI模型世界模型空间智能李飞飞 World Labs 模拟器

推荐理由：李飞飞把被滥用的「世界模型」概念理清了，做计算机视觉、机器人或生成式 AI 的开发者能直接对照自己的研究方向找到定位，建议点开看完整分类法。

04:12

04:12

a16z@a16z

精选

World Labs CEO李飞飞博士在a16z访谈中指出，语言模型擅长掌握概念、词汇和推理，但物理世界运行在空间与时间的基底上。她认为世界模型学习空间和时间的统计结构，例如光如何落在表面、物体如何响应力的物理规律。她强调语言让机器能谈论世界，而世界模型将让机器理解、想象、推理并与世界互动。

AI模型 Fei-Fei Li World Labs 世界模型空间智能

推荐理由：李飞飞讲世界模型和语言模型的本质区别

5月24日

16:28

16:28

rohanpaul_ai@rohanpaul_ai

李飞飞在a16z视频中定义机器人不是按人形或汽车等形态，而是按功能：任何必须在物理3D空间中感知、理解并行动的“具身机器”。她提出“空间智能”是机器人的统一原则，使机器人能执行任务并与人类协作。她指出人类一直局限于单一物理地球3D世界，但结合3D生成与重建的新技术正在打破这一限制，创造出无限数字宇宙，可用于训练机器人、激发创造力、旅行和叙事。

论文机器人空间智能 3D生成具身智能 a16z

推荐理由：李飞飞讲机器人本质，清晰又启发

5月20日

23:59

23:59

AK@_akhaliq

精选

ESI-Bench是一个新提出的基准测试，专门用于评估具身空间智能。它通过任务设计要求智能体闭合感知-行动循环，测试其在3D空间中的理解与交互能力。该基准由研究团队发布，旨在推动机器人具身智能领域的标准化评估。

AI模型 ESI-Bench 具身智能空间智能基准测试

推荐理由：新基准测试具身空间智能