10:10pandaily@contact@pandaily.com (Pandaily)73°阿里巴巴发布了Qwen-Robot系列,这是其首个具身AI模型系列,涵盖导航、操作和世界建模三个领域。该系列可部署在Unitree Go2四足机器人上,仅需一个摄像头就能运行。Qwen-Robot模型旨在让机器人更智能地感知和交互物理世界。AI模型Qwen-Robot阿里Unitree Go2具身AI机器人推荐理由:阿里给机器狗装上了AI大脑,单摄像头就能导航干活,Qwen-Robot系列挺实用。原文
00:55marktechpost@Asif Razzaq精选73°Qwen团队推出Qwen-RobotSuite,包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型,用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型,提供2B、4B和8B三种参数量。AI模型Qwen-RobotSuiteRobotManipRobotWorldRobotNav具身AI推荐理由:一口气发了三个模型,从操作到导航都管了,全用自家Qwen3.5和Qwen3-VL,做机器人研究的可以看看。原文
16:30pandaily@contact@pandaily.com (Pandaily)前联合国官员Sam Daws在中国人民大学的对话中指出,中国在人形机器人和具身AI领域已处于领先地位,未来十年可在全球AI治理中做出特殊贡献。他强调中国应推动全球南方国家的数字主权,并倡导中美欧三方在机器人标准制定上开展合作。Daws认为,中国在AI伦理和标准方面的参与对全球治理至关重要。行业AI治理人形机器人具身AI全球南方标准制定推荐理由:关注AI治理和机器人标准化的从业者值得一看——前联合国官员点出了中国在全球AI规则制定中的独特角色,做国际合作的团队可以从中找到方向。原文
10:02pandaily@contact@pandaily.com (Pandaily)比亚迪执行副总裁李柯确认,公司正秘密开发代号“尧舜禹”的人形机器人项目,该项目始于2022年,由比亚迪第15事业部负责,该部门专注于电子集成与智能化。此举标志着比亚迪从电动汽车领域向具身AI领域拓展,与特斯拉、小鹏等汽车巨头在人形机器人赛道上的竞争加剧。人形机器人被视为下一代智能终端,汽车制造商凭借制造、供应链和AI技术优势,正加速布局这一新兴领域。行业比亚迪人形机器人具身AI汽车行业智能终端推荐理由:比亚迪入局人形机器人,意味着具身AI赛道迎来重量级玩家,关注汽车与机器人交叉领域的从业者和投资者值得留意。原文
00:14Qdrant@qdrant_engineAWS 的 Sandhya Subramani 将在 Vector Space Day 上展示一个开源智能体框架,允许用户通过自然语言直接控制机器人。该框架将物理硬件暴露为可编程的智能体工具,采用混合架构:边缘端负责低延迟控制,云端处理复杂推理。这一演示旨在让具身 AI 更易用,降低机器人编程门槛。活动将于 6 月 11 日在旧金山 Midway 举行。AI产品开源/仓库智能体具身AI机器人AWS推荐理由:机器人开发者终于可以像聊天一样指挥硬件了——这个开源框架把物理设备变成智能体工具,边缘+云端分工明确,做机器人或 IoT 的团队值得关注,可以直接用起来。原文
11:17pandaily@contact@pandaily.com (Pandaily)小鹏汽车在2026年大湾区车展上展示了其完整的物理AI产品线,涵盖自动驾驶和具身AI技术,超越了传统电动汽车范畴。此次展示强调了小鹏在智能出行和人工智能融合方面的最新进展,包括自动驾驶系统和人形机器人等产品。这标志着小鹏从汽车制造商向AI技术公司的战略转型,展示了其在物理世界AI应用中的布局。AI产品小鹏物理AI自动驾驶具身AI车展推荐理由:小鹏的物理AI产品线展示了从自动驾驶到人形机器人的完整生态,关注智能出行和AI落地的读者值得一看,能直观感受未来出行与机器人技术的融合趋势。原文
15:12pandaily@contact@pandaily.com (Pandaily)荣耀在深圳高通骁龙粉丝节上发布了全球首款内置机械臂的智能手机 Robot Phone。该机械臂兼具云台功能,配合设备端具身 AI,可实现自主拍照和智能家居控制。这一创新将智能手机的交互方式从触控扩展到物理操作,为移动摄影和智能家居场景带来新可能。预计 2026 年 5 月上市。AI产品荣耀Robot Phone机械臂具身AI智能手机推荐理由:荣耀把机械臂塞进手机,解决了自拍和远程取景的物理限制,摄影爱好者和智能家居玩家值得关注,未来或许能直接用手势控制家电。原文
11:33arXiv cs.AI@Yajing Zhou, Xiangyu Kong精选该论文揭示了多模态大语言模型(MLLM)在空间推理中存在的“笛卡尔幻觉”——依赖文本概率分布而缺乏真正的3D拓扑理解。作者设计了一个新颖的视听任务:让智能体A推断智能体B对A相对位置的估计,以测试MLLM的二阶心智理论能力。为解决此问题,他们提出了“锚定具身空间分解思维链”,引导模型先建立B的局部坐标系,再根据A是否在B视野内动态加权视觉和听觉模态。实验表明,当前MLLM在零样本下准确率仅42%,而该感知受限推理链显著优于纯自我中心或他中心基线。这项工作暴露了MLLM空间推理的当前极限,并为具身AI中的认知模态感知推理建立了基础范式。论文多模态大模型空间推理心智理论具身AI思维链推荐理由:这篇论文戳破了MLLM空间推理的泡沫——它们并不真正理解3D世界。做具身AI、多智能体系统或空间推理的开发者,看完会重新评估模型能力边界。原文
16:16Paul Couvert@itsPaulAiNvidia 发布了名为 Cosmos 的 2.6B 参数开源世界模型,能够将单张图片、文本提示和轨迹转化为可控的虚拟世界。该模型可在单张 GPU(如 RTX 5090 或 H100)上运行,大幅降低了世界模型的使用门槛。代码和论文已分别发布在 GitHub 和 arXiv 上。该模型适用于具身 AI、机器人研究和仿真等场景,让更多研究者和开发者能够探索世界模型的应用。AI模型世界模型开源/仓库Nvidia具身AI仿真推荐理由:Nvidia 把世界模型的门槛打下来了——2.6B 参数、单 GPU 可跑、开源,做具身 AI 和机器人仿真的团队可以直接拿来用,省去从头训练的麻烦。原文