00:38量子位@思邈一家具身智能公司发布全球首个隐空间世界模型,实现长时序双向物理因果链建模。该公司刚完成2亿美元融资,并凭借该模型在具身智能榜单上排名第一。该模型可处理复杂时序物理交互,提升机器人长期规划能力。行业隐空间世界模型具身智能融资推荐理由:这家公司刚拿了2亿美元,用隐空间世界模型直接干到具身榜单第一,值得看他们怎么做到的。原文
21:08pandaily@contact@pandaily.com (Pandaily)X Square Robot 完成连续四轮融资,以 C 轮收官,估值攀升至 28 亿美元。该公司成为唯一一家同时获得中国四大互联网巨头(阿里巴巴、腾讯、百度、字节跳动)投资的具身 AI 企业。X Square Robot 专注于开发物理世界 AI 基础模型,旨在让机器人自主执行复杂操作。本轮融资凸显资本市场对具身智能赛道的高热度,资金将用于模型迭代与商业化落地。行业X Square Robot具身智能融资C轮AI基础模型推荐理由:X Square Robot 连融四轮,估值近200亿,四大巨头全投了,具身 AI 赛道真火,值得关注。原文
16:34pandaily@contact@pandaily.com (Pandaily)具身智能公司智平方(Zhipingfang)完成约50亿元新融资。其估值突破200亿元(约28亿美元),成为粤港澳大湾区首个具身智能独角兽。核心采用类脑NeuroVLA架构,模拟人脑多模态信息处理机制。行业ZhipingfangNeuroVLA具身智能类脑智能多模态推荐理由:智平方刚融了50亿,估值200亿,靠类脑NeuroVLA搞具身智能,大湾区第一个独角兽,挺有看头。原文
08:04IT之家(博客/媒体)我国开源生态版图扩容,新增人工智能、具身智能等7个前沿方向。2025年国内活跃开源项目突破425万个,活跃开发者达263万。GitHub平台中国活跃开发者超210万,全球第三;计入国内平台后整体开发者规模超350万,全球第二。中国OpenRank贡献度254,963,全球第二,预计7年后将超越美国成为第一。行业具身智能开源生态中国开发者OpenRankRISC-V推荐理由:我国开源生态又扩容了,新增具身智能等7个项目,开发者超350万全球第二,OpenRank贡献度7年后可能超越美国,看看细节!原文
11:42IT之家(博客/媒体)市场监管总局正加快制定智能体、具身智能、世界模型、本体模型等前沿技术国家标准,同时推进算力基础设施、高质量数据集、仿真测试平台等底座类标准。目前已发布《人工智能智能体互联》系列国家标准,共7个部分,旨在解决通信接口不统一、身份管理缺失及协同交互规则混乱等问题。该系列标准将推动智能体互联互通全流程规范统一,并提前划定技术合规边界。行业智能体具身智能国家标准市场监管总局AI安全推荐理由:国家在定智能体和具身智能的标准了,解决接口不统一的问题,搞AI开发的可以关注一下。原文
12:34berryxia@berryxia阿里通义实验室新视频指出,具身智能的核心难点在于物理世界的不确定性。机器人面临传感器噪声、执行延迟、环境变化等挑战,简单抓取动作可能因光线、摩擦差异失败。相比之下,语言和代码世界的scaling law仍在快速进步。行业通义实验室具身智能机器人物理世界推荐理由:想看AI在真实世界碰壁?阿里通义实验室这个视频讲透了机器人拿鸡蛋为啥那么难。原文
10:53arXiv cs.AI@Wen Ye, Peiyan Li, Tingyu Yuan, Yuan Xu, Xiangnan Wu, Chaoyang Zhao, Jing Liu, Nianfeng Liu, Yan Huang, Liang WangE-TTS是一个模块化、即插即用的具身测试时缩放框架,通过历史感知的迭代精炼和视觉语言验证器,统一了机器人操作中的推理和动作缩放。它采用推理-动作联合采样和成对评分,并引入历史缓冲区存储上下文,用于推理和动作验证器评估候选。与常规开环TTS不同,E-TTS在采样中引入反馈生成,形成闭环迭代精炼机制。实验在4个基准、6个环境、3个实体和4个基础VLA模型上进行,模拟场景提升33.14%,真实场景提升26.62%,无需额外数据收集或重新训练。AI模型E-TTS机器人操作测试时缩放视觉语言动作模型具身智能推荐理由:E-TTS团队搞了个新框架,不用重新训练就把机器人操作成功率在模拟中提33%,真实场景提26%,挺实用的。原文
10:52arXiv cs.AI@Junhao Shi, Zezheng Huai, Siyin Wang, Jia Chen, Yubang Wang, Zhaoye Fei, Hechang Chen, Jingjing Gong, Xipeng Qiu, Yu-Gang JiangOmniAct 提出了一个分层异步架构,将多模态语义规划器、基于事件边界压缩的自适应分层记忆和异步视觉抢占引擎模块化集成,以解决持久自主机器人的跨域工具调用与物理故障恢复问题。在40个真实世界长期任务中,使用两个机器人平台协调四个IoT设备,OmniAct在所有复杂度级别上端到端成功率一致提升,累积超过10万交互token时保持接近线性的token消耗,并让中等规模开源模型达到闭源模型性能。AI模型OmniAct具身智能多模态机器人IoT交互推荐理由:他们搞了个新架构,让机器人能自己协调API、物联网和物理动作,干活出错还能自己恢复,20个任务里成功率都比之前高,而且省钱省token。原文
22:54IT之家(博客/媒体)2025年中国具身智能市场规模约9150亿元,预计2026年将达10904亿元。全国具身智能相关企业数量已突破万家。链博会展示了从核心零部件到整机系统的产业闭环。国家发改委表示将加快训练基础设施建设,推进具身智能进入工厂、商场和家庭。教育部2026年本科专业目录新增具身智能等专业。行业具身智能机器人市场规模政策产业链推荐理由:市场规模已经9150亿了,年底就要破万亿,而且国家在推、大学在开专业,这赛道真的起飞了。原文
16:21Pandaily@contact@pandaily.com (Pandaily)RoboScience推出Visics,一个跨平台具身AI模型,能泛化到不同机器人、物体和任务。该模型基于端到端架构,在模拟和真实环境中均表现优越。实验显示,Visics在多种操作任务上成功率超过85%,远超现有基线方法。AI模型VisicsRoboScience具身智能机器人通用模型推荐理由:RoboScience出了个Visics模型,能跨不同机器人干活,不用每换一种就重新训练,有点意思。原文
09:21IT之家(博客/媒体)智元联合创始人兼总裁彭志辉在MWC26上海主题演讲中指出,AI下一阶段核心是从数字世界走进物理世界,自主完成任务。他强调未来AI将持续运行、学习并创造生产力,行业将迈入具身智能规模化部署时代。彭志辉提到特斯拉计划年底实现数千台人形机器人量产,波士顿动力也转向商业落地价值挖掘。他提出XYZ曲线划分产业发展周期,其中Y曲线是部署成长期,机器人具备完整交互作业能力,大规模落地真实场景。行业智元彭志辉MWC26具身智能机器人推荐理由:智元总裁彭志辉在MWC26上说了大实话:资本不再为机器人炫技买单,得在工厂、仓库真干活才行。还提到特斯拉计划年底量产数千台人形机器人,波士顿动力都转商业化了。原文
23:29IT之家(博客/媒体)摩根士丹利将2026年中国人形机器人出货量预测上调至5万台,相比此前2.8万台近乎翻倍。这是该机构今年第二次上调,年初预测为1.4万台。预计2026年市场规模达20亿美元,2030年增长至150亿美元。Omdia数据显示2025年全球出货1.3万台,前五名均为中国企业。分析师指出商业验证、政策支持和供应链信息表明普及速度加快。行业摩根士丹利人形机器人出货量市场规模具身智能推荐理由:摩根士丹利今年第二次上调中国人形机器人出货量预测,从2.8万台翻倍到5万台。背后是中国企业占据全球前五,工业部署加速。看看具体数据和市场预测吧。原文
18:54IT之家(博客/媒体)宇树科技宣布其双足人形机器人 Unitree R1 从原价 3.99 万元降至 2.99 万元起,并开放现货发售。R1 重量仅 25 千克,拥有 26 个关节(腿部12个、手臂10个、头部和腰部各2个),支持开发与定制。该机器人集成语音和图像多模态大模型,用户可自行改制。此次降价幅度达 1 万元。AI产品宇树科技Unitree R1人形机器人具身智能推荐理由:宇树把R1人形机器人降到2.99万了,现货直接买,26个关节还能自己改装,想玩机器人的可以看看。原文
20:18IT之家(博客/媒体)优必选在第四届中国国际供应链促进博览会上发布人形机器人Walker C1。该机器人身高1.64米,体重55公斤,拥有53个自由度,采用3D打印晶格结构。它搭载2070 TOPS端侧算力和Thinker具身智能大模型,能完成芭蕾、华尔兹等复杂动作并实现人机共舞。Walker C1面向接待导览、商业服务、娱乐互动、教育科研等多场景,并开放接口支持用户二次开发。AI产品优必选Walker C1人形机器人具身智能商用服务推荐理由:优必选发布Walker C1人形机器人,能跳芭蕾和人机共舞,搭载2070TOPS算力和Thinker大模型,面向商用服务。原文
10:51pandaily@contact@pandaily.com (Pandaily)北京正在加速建设AI生态系统,力图成为全球AI之都。该生态重点涵盖机器人手术和具身智能两大领域。北京设定了万亿级AI产业目标,推动从实验室到应用的发展。行业北京机器人手术具身智能推荐理由:北京要冲世界AI之都,机器人手术和具身智能是主力,还有万亿产业目标,挺有看头。原文
19:23量子位@鱼羊2026年上半年,具身智能赛道融资额已接近去年全年水平。超过一半的资金流向了机器人“大脑”相关的模型与算法研发。这表明行业正集中资源攻克智能体的核心能力。行业具身智能融资机器人2026推荐理由:今年具身智能融资太火了,一半钱都砸向机器人脑子,值得看看钱去哪了原文
16:42Tw93@HiTw93这篇推特汇总了作者6篇关于AI面试准备的文章,涵盖Claude Code的架构与治理、Agent的原理与工程实践、大模型训练原理与路径、AI Coding的实战场景、GEO的可见性原理以及具身智能从机器狗到Optimus的演进。每篇文章针对AI岗位工程师转型提供了具体知识。作者祝福传统工程师转型成功。技巧Claude CodeAgentAI Coding具身智能面试准备推荐理由:朋友推荐的6篇文章,从Claude Code到具身智能,面试AI岗位看这些就够了。原文
11:40berryxia@berryxia在YC访谈中,李飞飞指出世界模型需要超越平面像素和语言,捕捉3D结构和空间智能。Aether AI的因果世界模型进一步补全推理能力,使模型从学习相关性进化到理解因果关系。两条路线(3D空间表征+因果推理)结合,有望推动具身智能从模仿到思考的范式转变。行业李飞飞空间智能因果世界模型世界模型具身智能推荐理由:李飞飞直接点名空间智能是下一波重点,还和Aether AI的因果世界模型对上了线。看懂物理世界,AI才能真变聪明。原文
10:28IT之家(博客/媒体)2026世界人工智能大会将于7月17日至20日在上海举办,主题为“智能伙伴,共创未来”。大会首次创办高水平国际学术会议“WAIC Academic”,已收到来自11个国家和地区的284篇有效投稿。展览面积超10万平方米,安排近140场论坛,超300款AI产品将全球首发。大会还揭晓了2026年SAIL奖TOP30榜单,覆盖智能体、算力芯片、具身智能等领域。行业世界人工智能大会WAIC上海AI治理具身智能推荐理由:今年7月上海有场AI大会,300多款新品首发,图灵奖得主主持学术会议,感兴趣可以关注。原文
10:08Pandaily@contact@pandaily.com (Pandaily)阿里巴巴发布Qwen-Robot具身AI模型系列,进军机器人领域。字节跳动将机器人业务提升为核心业务,两大互联网巨头利用各自数据、AI大脑和场景优势重塑中国机器人行业。Qwen-Robot系列基于阿里通义千问大模型,支持多种机器人形态。字节跳动则通过其AI技术和应用场景推动机器人商业化。行业AlibabaByteDanceQwen-Robot具身智能机器人推荐理由:阿里发了Qwen-Robot具身AI模型,字节把机器人当核心业务了。看互联网巨头怎么用数据和AI做机器人,和传统公司不一样。原文
09:51berryxia@berryxia精选当前Physical AI的VLA模型仅在统计相关性上学习,桌子高2cm即失败。UCSD黄碧薇教授在CVPR 2026发布Causal World Models框架,让AI从模仿动作进化到理解因果。她创立的Aether AI获得2000万美元融资,成为全球首个因果世界模型公司。与杨立昆AMI(融10亿美元)和李飞飞World Labs(10亿美元)等不同,Aether AI不卷规模而卷因果结构。AI模型Causal World ModelsAether AIVLA因果模型具身智能推荐理由:黄碧薇教授不堆数据,教AI理解物理因果。Aether AI刚融资2000万美元,可能改变具身智能的游戏规则。原文
00:35量子位@henry71°一家头部具身大脑公司完成数亿美元新一轮融资,投资方共15家VC。该公司坚持世界模型技术路线,半年内先后在开源、端侧和训练场三个方向发布方案。具体开源项目名称和端侧部署参数尚未披露。训练场支持与多种机器人硬件适配。该轮融资将用于扩大研发团队和加速产品落地。行业具身智能融资世界模型开源模型端侧部署推荐理由:一家专注具身大脑的公司又融了一大笔钱,世界模型路线,15家VC跟进。开源、端侧、训练场三连发,你可以关注它的技术方案。原文
11:40IT之家(博客/媒体)大晓机器人联合香港中文大学发布并开源具身操作VLA模型ACE-Ego。在RoboCasa GR1 TableTop基准上,ACE-Ego以72.8%平均成功率刷新纪录,超越英伟达GR00T、PI π₀.₅等模型。在RoboTwin 2.0高难度双臂操作测试中,ACE-Ego成功率90.62%。该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等零售操作。AI模型ACE-Ego大晓机器人人形机器人具身智能开源模型推荐理由:大晓机器人开源了新模型ACE-Ego,在人形机器人操作基准上拿了第一,能打包塑料袋、装鞋盒,挺实用的。原文
10:46arXiv cs.AI@Qi Chai, Wenhao Shen, Nanjie Yao, Yue Xia, Kaiyong Zhao, Jie Ma, Guosheng Lin, Hao WangEvolveNav 提出了一种自演化框架,用于零样本物体目标导航,无需预先训练。该方法通过构建代理规则记忆,从过往轨迹中提取可操作知识,并采用基于上置信界(UCB)的检索策略平衡语义相关性和历史成功率。还引入了记忆引导的前置反思模块,在行动前预测潜在结果,减少低效探索。实验表明,EvolveNav 在多个基准上超越现有零样本基线,成功率提升 10.1%,同时减少了不必要的步骤。论文EvolveNav零样本物体导航记忆机制具身智能推荐理由:这篇论文搞了个EvolveNav,让机器人自己从失败中学习,零样本导航成功率直接涨了10%,而且没走那么多冤枉路。原文
10:41arXiv cs.AI@Josef Liyanjun Chen该研究将机器人闪存耐久性视为非可再生资源,提出用单个影子价格η优化数据在RAM、板载NVM和云之间的分布。在重复长程操作场景中,价值-写入关联χ的测量值约为+1.0×10^{-3},短程场景中接近零,非重复遥操作场景中为负。高端TLC闪存(3000 P/E)上耐久预算不构成约束,但廉价QLC/eMMC(约1000 P/E)上具有约束性。学习型磨损感知控制器在任务价值上与基于价格的路由持平,因为实现的价值在不同层级间保持不变。非单调最优已被证明但尚未在实验数据中观察到。论文具身智能闪存耐久性影子价格NVM云存储推荐理由:这篇论文把机器人闪存写寿命当成钱来算,发现只有便宜芯片上才需要省着用,高端芯片随便写。读它学怎么用价格信号管好机器人记忆。原文
09:37arXiv cs.AI@Bochen Yang, Lianlei Shan精选PearlVLA提出一种将动作规划调度到VLM潜在空间的新框架,通过将元查询表示分为视觉定位分支和迭代潜在规划分支,利用冻结的潜在世界模型生成未来观测,并经过K轮细化后并行解码动作块。在LIBERO基准上,PearlVLA达到了现有方法中的最佳性能,证明了潜在空间推理在降低延迟的同时提升规划质量的有效性。AI模型PearlVLAVLA模型具身智能LIBERO动作规划推荐理由:这篇论文提出了PearlVLA,把动作规划放到了潜在空间里,比传统文本链式推理延迟更低,在LIBERO上刷了SOTA,做具身智能的可以看看。原文
04:50阿里通义 Qwen@Alibaba_Qwen76°阿里Qwen团队推出Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一了5种导航任务(指令跟随、点目标、物体目标、目标跟踪、自动驾驶),支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间,预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型,支持20+种具身形态,通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。AI模型Qwen-RobotNavQwen-RobotManipQwen-RobotWorld阿里巴巴具身智能推荐理由:阿里刚发了三款机器人基础模型,导航、操作、世界模型全包了,数据量和工作范围都挺具体,搞具身智能的可以看看。原文
04:49阿里通义 Qwen@Alibaba_Qwen精选72°Qwen-RobotWorld由阿里巴巴Qwen团队发布,将自然语言视为通用动作接口,统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库(860万视频-文本对、超2亿帧)上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。AI模型Qwen-RobotWorld阿里巴巴具身智能视频生成基准测试推荐理由:Qwen把自然语言当遥控器,一个模型搞定机器臂、自动驾驶、无人机等20多种动作,还赢了多个基准,挺有意思。原文
22:10阿里云 Alibaba Cloud@alibaba_cloud76°阿里云发布Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一5种导航任务(指令跟随、点目标、物目标、目标跟踪、自动驾驶);Qwen-RobotManip在38,100+小时开源语料上预训练,实现异构机器人统一状态-动作空间;Qwen-RobotWorld支持20+具身化身,通过自然语言接口预测物理世界未来。三个模型可独立使用或组合,构成通用具身智能系统的底层工具包。AI模型QwenRobot具身智能机器人导航基础模型推荐理由:阿里云一口气发了三个机器人基础模型:导航、操作、世界模型,每个都能单独用,还能组合。Qwen-RobotManip在3.8万小时数据上预训练,挺实在的。原文
12:23IT之家(博客/媒体)阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列,包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld。这三个模型分别为机器人提供灵巧的手、认路的脚和会思考的大脑,可单独部署也能协同运转。此前,Qwen3.7-Max 在 Arena 全球大模型盲测中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产模型第一。AI模型Qwen-Robot阿里巴巴具身智能Qwen-RobotManip机器人1 个信源在谈推荐理由:阿里推出了首个具身智能模型系列 Qwen-Robot,包含操作、移动和世界模型,为机器人打造通用底座。原文
18:43IT之家(博客/媒体)李想在Livis Day上提出具身智能汽车定义,认为传统智能汽车仍是功能驱动。具身智能汽车是“四位一体”:电动汽车、职业司机、AI计算机、生活助手。其中电动汽车和AI计算机是“具身”,职业司机和生活助手是“智能”。该定义从安全、能力、效率三个维度区别于传统智能汽车。行业理想汽车李想Livis Day具身智能智能汽车推荐理由:理想李想把具身智能汽车讲清楚了——四个角色合体,和传统智能车完全不是一回事。原文
16:42IT之家(博客/媒体)赛力斯人形机器人“小赛”在超级工厂首次亮相,具备视觉识别和语音互动能力,可作为向导。副总裁康波透露今年内还有更多种类具身智能机器人面世。赛力斯超级工厂已配备地空一体物流、AI检测机器人“小赛01/02”、物流机器人、协作机器人等,拥有1600+智能化设备和3000+工业机器人协同工作。AI产品赛力斯人形机器人小赛具身智能工业机器人推荐理由:赛力斯秀了人形机器人“小赛”,能识别、能打招呼,今年还会有更多机器人。工业机器人数量也不少。原文
10:11pandaily@contact@pandaily.com (Pandaily)中国初创公司赛度科技于 2026 年 6 月推出新品牌 AIVA,将人工智能置于硬件之前,重新定义汽车为具身智能体。AIVA 采用端到端 AI 架构,支持 OTA 持续升级,其核心是名为“EVA”的 AI 操作系统。该系统整合了多模态感知、决策与执行,使车辆能像智能体一样与环境交互。赛度科技计划在 2027 年交付首批 AIVA 车型,定价区间为 20 万至 35 万元人民币。AI产品AIVASaidou Technology具身智能AI定义汽车EVA推荐理由:赛度把汽车做成AI智能体原文
17:22量子位@一水精选Jiuwen Symbiosis是一个将AI Agent与物理实体结合的框架,通过整合传感器、执行器和实时控制,使Agent能直接与环境交互。该框架在工业机器人测试中实现了90%的任务完成率,相比传统方案提升30%。它支持多模态感知(视觉、触觉、力觉)和动态规划,已在仓储物流场景中部署。实践表明,这种具身智能系统能有效处理非结构化环境中的复杂操作。AI模型Jiuwen Symbiosis智能体具身智能多模态工业机器人推荐理由:让AI Agent动起来干活原文
16:51IT之家(博客/媒体)小鹏集团副总裁余鹏在2026中国汽车重庆论坛上明确公司定位为“面向全球的具身智能公司”,透露飞行汽车并非孤立业务,而是与芯片、机器人共同构成AI技术的协同矩阵。汽车上验证的AI底盘能力、全栈自研技术、端到端运动控制效率可复用至飞行汽车等智能终端,机器人操作经验也反哺汽车。小鹏分体式飞行汽车已于今年3月批量试产下线,计划2026年内启动规模化量产,采用分体式设计,飞行器可完全收纳进陆行体后备箱。行业小鹏飞行汽车具身智能AI协同推荐理由:小鹏把飞行汽车、芯片、机器人串起来了原文
17:17掘金本周最热@倔强的石头_魔珐星云通过自研参数流架构,将大模型从纯文本对话框解放出来,赋予其3D数字人具身交互能力。该方案实现端到端约500ms毫秒级响应,在百元级硬件上流畅运行,解决了传统云端视频流方案的高延迟、音画不同步和高成本问题。开发者仅需一个HTML文件即可集成DeepSeek等国产大模型与3D数字人,实现实时眼神交流、表情和肢体动作的交互体验。AI产品具身智能3D数字人DeepSeek魔珐星云低延迟交互推荐理由:做AI交互应用或数字人产品的开发者,可以用一个HTML文件让大模型拥有3D躯壳,交互延迟降到500ms,值得直接上手试。原文
16:07pandaily@contact@pandaily.com (Pandaily)北京星源智机器人公司在10个月内累计融资10亿元人民币,专注于开发具身智能的“大脑”技术。这笔资金将用于加速其AI大脑的研发和商业化,旨在让机器人具备更高级的感知、决策和行动能力。该公司的技术路线强调将AI与机器人硬件深度融合,以推动服务机器人和工业机器人的智能化升级。此次融资反映了资本市场对具身智能赛道的高度关注,尤其是在机器人核心智能技术上的投资热情。行业具身智能机器人融资AI大脑星源智推荐理由:具身智能是AI的下一个前沿,星源智的融资规模说明资本正在加速押注机器人大脑技术。做机器人硬件或AI算法的团队值得关注,看看他们的技术路线能否解决当前机器人的智能瓶颈。原文
11:28arXiv cs.AI@Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar, Mozhgan Nasr Azadani, Katie Luo, Clark Barrett, Jiajun Wu, Chelsea Finn, Marco Pavone精选72°DIRECT 是一个路由框架,利用多模态场景上下文为每个提示分配测试时计算资源,以改善成功-成本帕累托前沿。研究发现,在链式思维深度、模型大小和记忆历史三个缩放轴上,测试时计算并非均匀杠杆,不同轴带来不同能力增益。在 VLABench 和 RoboMME 上的实验表明,DIRECT 在物理 Franka 机械臂上匹配或超越更强模型的成功率,同时平均延迟降低高达 65%。该工作揭示了朴素缩放测试时计算的浪费性,为具身代理的部署提供了更高效的方案。论文具身智能测试时计算路由框架VLM机器人规划推荐理由:DIRECT 解决了具身规划中测试时计算资源浪费的问题,做机器人部署和 VLM 应用的团队可以直接参考其路由策略,在降低成本的同时保持性能。原文
11:20IT之家(博客/媒体)京东在 618 期间于京东 MALL 引入多款智能机器人作为实习员工,覆盖迎宾、导购、理货、咨询等核心零售场景。这些机器人包括智元 X2 人形机器人、宇树 Go2 四足机器狗等,基于具身智能技术提升线下消费体验。京东还宣布建成全球最大具身智能数据采集中心,计划发动数十万人参与数据采集,以推动行业技术发展。此举标志着具身智能在零售领域的规模化落地,为线下门店运营模式带来变革。AI产品具身智能机器人京东零售数据采集推荐理由:京东把具身智能从概念拉进了真实零售场景,做线下零售或机器人应用的团队值得关注——这是少有的多机型、多岗位协同的实战案例,可以直接参考其岗位分工和数据采集模式。原文
11:17IT之家(博客/媒体)理想汽车将于6月15日举办Livis Day软件与人工智能发布会,探讨具身智能的定义与价值。CEO李想发文回应外界对其“不务正业”的质疑,强调基于汽车形态的具身智能是首个进入物理世界的人工智能机器人。李想此前在内部会议中提出关键时间节点:2026年是AI头部公司上车的最后一年,2028年L4级自动驾驶将落地。理想汽车计划布局基座模型、芯片、操作系统和具身智能,并明确将做人形机器人,双轮机器人产品已准备好,预计年中发布用于工厂场景。发布会将分享具身智能的标准、用户价值及体验时间表。行业理想汽车具身智能AI发布会人形机器人L4自动驾驶推荐理由:李想首次系统回应AI战略质疑,并给出具身智能的落地时间表,关注智能汽车和机器人赛道的从业者值得一看,能提前了解理想在AI领域的布局节奏。原文