全部 AI 动态 · AI 热点

AITOP

6月26日

12:34

berryxia@berryxia

阿里通义实验室新视频指出，具身智能的核心难点在于物理世界的不确定性。机器人面临传感器噪声、执行延迟、环境变化等挑战，简单抓取动作可能因光线、摩擦差异失败。相比之下，语言和代码世界的scaling law仍在快速进步。

行业通义实验室具身智能机器人物理世界

推荐理由：想看AI在真实世界碰壁？阿里通义实验室这个视频讲透了机器人拿鸡蛋为啥那么难。

原文

6月19日

16:42

Tw93@HiTw93

这篇推特汇总了作者6篇关于AI面试准备的文章，涵盖Claude Code的架构与治理、Agent的原理与工程实践、大模型训练原理与路径、AI Coding的实战场景、GEO的可见性原理以及具身智能从机器狗到Optimus的演进。每篇文章针对AI岗位工程师转型提供了具体知识。作者祝福传统工程师转型成功。

技巧 Claude Code Agent AI Coding 具身智能面试准备

推荐理由：朋友推荐的6篇文章，从Claude Code到具身智能，面试AI岗位看这些就够了。

原文

6月18日

11:40

berryxia@berryxia

在YC访谈中，李飞飞指出世界模型需要超越平面像素和语言，捕捉3D结构和空间智能。Aether AI的因果世界模型进一步补全推理能力，使模型从学习相关性进化到理解因果关系。两条路线（3D空间表征+因果推理）结合，有望推动具身智能从模仿到思考的范式转变。

行业李飞飞空间智能因果世界模型世界模型具身智能

推荐理由：李飞飞直接点名空间智能是下一波重点，还和Aether AI的因果世界模型对上了线。看懂物理世界，AI才能真变聪明。

原文

09:51

berryxia@berryxia

精选

当前Physical AI的VLA模型仅在统计相关性上学习，桌子高2cm即失败。UCSD黄碧薇教授在CVPR 2026发布Causal World Models框架，让AI从模仿动作进化到理解因果。她创立的Aether AI获得2000万美元融资，成为全球首个因果世界模型公司。与杨立昆AMI（融10亿美元）和李飞飞World Labs（10亿美元）等不同，Aether AI不卷规模而卷因果结构。

AI模型 Causal World Models Aether AI VLA 因果模型具身智能

推荐理由：黄碧薇教授不堆数据，教AI理解物理因果。Aether AI刚融资2000万美元，可能改变具身智能的游戏规则。

原文

6月17日

04:50

阿里通义 Qwen@Alibaba_Qwen

76°

阿里Qwen团队推出Qwen-Robot Suite，包含三个基础模型：Qwen-RobotNav统一了5种导航任务（指令跟随、点目标、物体目标、目标跟踪、自动驾驶），支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间，预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型，支持20+种具身形态，通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。

AI模型 Qwen-RobotNav Qwen-RobotManip Qwen-RobotWorld 阿里巴巴具身智能

推荐理由：阿里刚发了三款机器人基础模型，导航、操作、世界模型全包了，数据量和工作范围都挺具体，搞具身智能的可以看看。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

精选72°

Qwen-RobotWorld由阿里巴巴Qwen团队发布，将自然语言视为通用动作接口，统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库（860万视频-文本对、超2亿帧）上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。

AI模型 Qwen-RobotWorld 阿里巴巴具身智能视频生成基准测试

推荐理由：Qwen把自然语言当遥控器，一个模型搞定机器臂、自动驾驶、无人机等20多种动作，还赢了多个基准，挺有意思。

原文

6月16日

22:10

阿里云 Alibaba Cloud@alibaba_cloud

76°

阿里云发布Qwen-Robot Suite，包含三个基础模型：Qwen-RobotNav统一5种导航任务（指令跟随、点目标、物目标、目标跟踪、自动驾驶）；Qwen-RobotManip在38,100+小时开源语料上预训练，实现异构机器人统一状态-动作空间；Qwen-RobotWorld支持20+具身化身，通过自然语言接口预测物理世界未来。三个模型可独立使用或组合，构成通用具身智能系统的底层工具包。

AI模型 Qwen Robot 具身智能机器人导航基础模型

推荐理由：阿里云一口气发了三个机器人基础模型：导航、操作、世界模型，每个都能单独用，还能组合。Qwen-RobotManip在3.8万小时数据上预训练，挺实在的。

原文

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月6日

02:46

Jim Fan@jimfan

NitroGen 项目在 CVPR 2025 上获得最佳论文荣誉提名，标志着通用具身智能体研究的重要进展。该工作旨在让智能体不仅掌握真实世界物理，还能适应多宇宙模拟中的各种物理规则。这是该团队继 MineDojo（在 Minecraft 中的首个具身智能体）获得 NeurIPS 最佳论文奖四年后的又一里程碑。NitroGen 的突破意味着具身智能体正从单一环境向跨领域泛化迈进。

论文具身智能 CVPR 最佳论文 NitroGen 通用智能体

推荐理由：做具身智能和仿真研究的团队值得关注——NitroGen 解决了智能体跨物理规则泛化的核心难题，看完会理解通用智能体的下一个突破口在哪。

原文

6月1日

09:36

Greg Brockman@gdb

OpenAI Robotics 正在快速推进物理世界 AI 的研发，目标是让 AI 在现实世界中帮助人类。短期重点是为熟练工人制造机器人，支持基础设施建设；长期愿景是让每个人拥有个人机器人。团队由 Aditya Ramesh 领导，基于硬件与 ML 研究的协同设计。目前正在招聘全栈硬件、运营、系统和 ML 工程师，要求有卓越成就。

行业机器人具身智能 OpenAI 招聘硬件

推荐理由：OpenAI 正式重启机器人团队，从模拟研究转向硬件落地，做机器人或具身智能的开发者值得关注——这是少有的从硬件到 ML 全栈招聘，机会难得。

原文

5月24日

16:28

rohanpaul_ai@rohanpaul_ai

李飞飞在a16z视频中定义机器人不是按人形或汽车等形态，而是按功能：任何必须在物理3D空间中感知、理解并行动的“具身机器”。她提出“空间智能”是机器人的统一原则，使机器人能执行任务并与人类协作。她指出人类一直局限于单一物理地球3D世界，但结合3D生成与重建的新技术正在打破这一限制，创造出无限数字宇宙，可用于训练机器人、激发创造力、旅行和叙事。

论文机器人空间智能 3D生成具身智能 a16z

推荐理由：李飞飞讲机器人本质，清晰又启发

原文

5月20日

23:59

AK@_akhaliq

精选

ESI-Bench是一个新提出的基准测试，专门用于评估具身空间智能。它通过任务设计要求智能体闭合感知-行动循环，测试其在3D空间中的理解与交互能力。该基准由研究团队发布，旨在推动机器人具身智能领域的标准化评估。

AI模型 ESI-Bench 具身智能空间智能基准测试

推荐理由：新基准测试具身空间智能

原文

5月17日

01:29

berryxia@berryxia

HuggingPapers 推送了一篇重磅综述《World Action Models: The Next Frontier in Embodied AI》，首次系统定义了 WAMs 概念。WAMs 是能同时预测未来世界状态并生成真实可执行动作的具身基础模型，区别于仅处理语言的传统模型。论文梳理了架构设计、数据生态和评估协议，并附有 2024-2026 年发展时间线。这标志着具身智能从“思考”迈向“行动”的关键一步。

论文具身智能 World Action Models 综述机器人世界模型

推荐理由：这篇综述系统定义了 WAMs，解决了具身智能从“想”到“做”的落地难题，做机器人、具身 Agent 或世界模型的开发者值得收藏，直接看时间线图就能把握未来方向。

原文

5月16日

20:48

orange.ai@oran_ge

李想在与老罗的播客对话中，对 AI 时代的一人公司模式持怀疑态度，认为很多一人公司只是更新内容验证概念，并未建立真实生产环境。他强调 AI 应服务于增效而非降本，建议企业不要裁员，因为 AI 是放大器，会放大人的原有能力。他还谈到出海同样内卷，战略选择至关重要，并分享了具身智能的商业化方向，认为分拣、拧螺丝已自动化，上料和运输才是机会。最后，他通过《星际穿越》表达了对人类价值的乐观态度。

行业 AI 创业一人公司增效降本具身智能战略选择

推荐理由：李想对 AI 时代一人公司模式的犀利批判，给正在探索 AI 创业的团队提了个醒——别只做内容验证，要建立真实生产环境。做 AI 产品的创始人和企业管理者值得点开，看完会重新思考增效与降本、裁员与用人的策略。

原文