12:34berryxia@berryxia阿里通义实验室新视频指出,具身智能的核心难点在于物理世界的不确定性。机器人面临传感器噪声、执行延迟、环境变化等挑战,简单抓取动作可能因光线、摩擦差异失败。相比之下,语言和代码世界的scaling law仍在快速进步。行业通义实验室具身智能机器人物理世界推荐理由:想看AI在真实世界碰壁?阿里通义实验室这个视频讲透了机器人拿鸡蛋为啥那么难。原文
16:42Tw93@HiTw93这篇推特汇总了作者6篇关于AI面试准备的文章,涵盖Claude Code的架构与治理、Agent的原理与工程实践、大模型训练原理与路径、AI Coding的实战场景、GEO的可见性原理以及具身智能从机器狗到Optimus的演进。每篇文章针对AI岗位工程师转型提供了具体知识。作者祝福传统工程师转型成功。技巧Claude CodeAgentAI Coding具身智能面试准备推荐理由:朋友推荐的6篇文章,从Claude Code到具身智能,面试AI岗位看这些就够了。原文
11:40berryxia@berryxia在YC访谈中,李飞飞指出世界模型需要超越平面像素和语言,捕捉3D结构和空间智能。Aether AI的因果世界模型进一步补全推理能力,使模型从学习相关性进化到理解因果关系。两条路线(3D空间表征+因果推理)结合,有望推动具身智能从模仿到思考的范式转变。行业李飞飞空间智能因果世界模型世界模型具身智能推荐理由:李飞飞直接点名空间智能是下一波重点,还和Aether AI的因果世界模型对上了线。看懂物理世界,AI才能真变聪明。原文
09:51berryxia@berryxia精选当前Physical AI的VLA模型仅在统计相关性上学习,桌子高2cm即失败。UCSD黄碧薇教授在CVPR 2026发布Causal World Models框架,让AI从模仿动作进化到理解因果。她创立的Aether AI获得2000万美元融资,成为全球首个因果世界模型公司。与杨立昆AMI(融10亿美元)和李飞飞World Labs(10亿美元)等不同,Aether AI不卷规模而卷因果结构。AI模型Causal World ModelsAether AIVLA因果模型具身智能推荐理由:黄碧薇教授不堆数据,教AI理解物理因果。Aether AI刚融资2000万美元,可能改变具身智能的游戏规则。原文
04:50阿里通义 Qwen@Alibaba_Qwen76°阿里Qwen团队推出Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一了5种导航任务(指令跟随、点目标、物体目标、目标跟踪、自动驾驶),支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间,预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型,支持20+种具身形态,通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。AI模型Qwen-RobotNavQwen-RobotManipQwen-RobotWorld阿里巴巴具身智能推荐理由:阿里刚发了三款机器人基础模型,导航、操作、世界模型全包了,数据量和工作范围都挺具体,搞具身智能的可以看看。原文
04:49阿里通义 Qwen@Alibaba_Qwen精选72°Qwen-RobotWorld由阿里巴巴Qwen团队发布,将自然语言视为通用动作接口,统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库(860万视频-文本对、超2亿帧)上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。AI模型Qwen-RobotWorld阿里巴巴具身智能视频生成基准测试推荐理由:Qwen把自然语言当遥控器,一个模型搞定机器臂、自动驾驶、无人机等20多种动作,还赢了多个基准,挺有意思。原文
22:10阿里云 Alibaba Cloud@alibaba_cloud76°阿里云发布Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一5种导航任务(指令跟随、点目标、物目标、目标跟踪、自动驾驶);Qwen-RobotManip在38,100+小时开源语料上预训练,实现异构机器人统一状态-动作空间;Qwen-RobotWorld支持20+具身化身,通过自然语言接口预测物理世界未来。三个模型可独立使用或组合,构成通用具身智能系统的底层工具包。AI模型QwenRobot具身智能机器人导航基础模型推荐理由:阿里云一口气发了三个机器人基础模型:导航、操作、世界模型,每个都能单独用,还能组合。Qwen-RobotManip在3.8万小时数据上预训练,挺实在的。原文
02:46Jim Fan@jimfanNitroGen 项目在 CVPR 2025 上获得最佳论文荣誉提名,标志着通用具身智能体研究的重要进展。该工作旨在让智能体不仅掌握真实世界物理,还能适应多宇宙模拟中的各种物理规则。这是该团队继 MineDojo(在 Minecraft 中的首个具身智能体)获得 NeurIPS 最佳论文奖四年后的又一里程碑。NitroGen 的突破意味着具身智能体正从单一环境向跨领域泛化迈进。论文具身智能CVPR最佳论文NitroGen通用智能体推荐理由:做具身智能和仿真研究的团队值得关注——NitroGen 解决了智能体跨物理规则泛化的核心难题,看完会理解通用智能体的下一个突破口在哪。原文
09:36Greg Brockman@gdbOpenAI Robotics 正在快速推进物理世界 AI 的研发,目标是让 AI 在现实世界中帮助人类。短期重点是为熟练工人制造机器人,支持基础设施建设;长期愿景是让每个人拥有个人机器人。团队由 Aditya Ramesh 领导,基于硬件与 ML 研究的协同设计。目前正在招聘全栈硬件、运营、系统和 ML 工程师,要求有卓越成就。行业机器人具身智能OpenAI招聘硬件10 个信源在谈推荐理由:OpenAI 正式重启机器人团队,从模拟研究转向硬件落地,做机器人或具身智能的开发者值得关注——这是少有的从硬件到 ML 全栈招聘,机会难得。原文
16:28rohanpaul_ai@rohanpaul_ai李飞飞在a16z视频中定义机器人不是按人形或汽车等形态,而是按功能:任何必须在物理3D空间中感知、理解并行动的“具身机器”。她提出“空间智能”是机器人的统一原则,使机器人能执行任务并与人类协作。她指出人类一直局限于单一物理地球3D世界,但结合3D生成与重建的新技术正在打破这一限制,创造出无限数字宇宙,可用于训练机器人、激发创造力、旅行和叙事。论文机器人空间智能3D生成具身智能a16z推荐理由:李飞飞讲机器人本质,清晰又启发原文
23:59AK@_akhaliq精选ESI-Bench是一个新提出的基准测试,专门用于评估具身空间智能。它通过任务设计要求智能体闭合感知-行动循环,测试其在3D空间中的理解与交互能力。该基准由研究团队发布,旨在推动机器人具身智能领域的标准化评估。AI模型ESI-Bench具身智能空间智能基准测试推荐理由:新基准测试具身空间智能原文
01:29berryxia@berryxiaHuggingPapers 推送了一篇重磅综述《World Action Models: The Next Frontier in Embodied AI》,首次系统定义了 WAMs 概念。WAMs 是能同时预测未来世界状态并生成真实可执行动作的具身基础模型,区别于仅处理语言的传统模型。论文梳理了架构设计、数据生态和评估协议,并附有 2024-2026 年发展时间线。这标志着具身智能从“思考”迈向“行动”的关键一步。论文具身智能World Action Models综述机器人世界模型推荐理由:这篇综述系统定义了 WAMs,解决了具身智能从“想”到“做”的落地难题,做机器人、具身 Agent 或世界模型的开发者值得收藏,直接看时间线图就能把握未来方向。原文
20:48orange.ai@oran_ge李想在与老罗的播客对话中,对 AI 时代的一人公司模式持怀疑态度,认为很多一人公司只是更新内容验证概念,并未建立真实生产环境。他强调 AI 应服务于增效而非降本,建议企业不要裁员,因为 AI 是放大器,会放大人的原有能力。他还谈到出海同样内卷,战略选择至关重要,并分享了具身智能的商业化方向,认为分拣、拧螺丝已自动化,上料和运输才是机会。最后,他通过《星际穿越》表达了对人类价值的乐观态度。行业AI 创业一人公司增效降本具身智能战略选择推荐理由:李想对 AI 时代一人公司模式的犀利批判,给正在探索 AI 创业的团队提了个醒——别只做内容验证,要建立真实生产环境。做 AI 产品的创始人和企业管理者值得点开,看完会重新思考增效与降本、裁员与用人的策略。原文