全部 AI 动态 · AI 热点

AITOP

6月26日

12:34

berryxia@berryxia

阿里通义实验室新视频指出，具身智能的核心难点在于物理世界的不确定性。机器人面临传感器噪声、执行延迟、环境变化等挑战，简单抓取动作可能因光线、摩擦差异失败。相比之下，语言和代码世界的scaling law仍在快速进步。

行业通义实验室具身智能机器人物理世界

推荐理由：想看AI在真实世界碰壁？阿里通义实验室这个视频讲透了机器人拿鸡蛋为啥那么难。

原文

10:52

arXiv cs.AI@Junhao Shi, Zezheng Huai, Siyin Wang, Jia Chen, Yubang Wang, Zhaoye Fei, Hechang Chen, Jingjing Gong, Xipeng Qiu, Yu-Gang Jiang

OmniAct 提出了一个分层异步架构，将多模态语义规划器、基于事件边界压缩的自适应分层记忆和异步视觉抢占引擎模块化集成，以解决持久自主机器人的跨域工具调用与物理故障恢复问题。在40个真实世界长期任务中，使用两个机器人平台协调四个IoT设备，OmniAct在所有复杂度级别上端到端成功率一致提升，累积超过10万交互token时保持接近线性的token消耗，并让中等规模开源模型达到闭源模型性能。

AI模型 OmniAct 具身智能多模态机器人 IoT交互

推荐理由：他们搞了个新架构，让机器人能自己协调API、物联网和物理动作，干活出错还能自己恢复，20个任务里成功率都比之前高，而且省钱省token。

原文

00:06

techcrunch@Rebecca Bellan

AI公司General Intuition在最新一轮融资中筹集3.2亿美元，累计融资额达23亿美元。该公司利用《堡垒之夜》等数百万小时游戏数据训练AI智能体，旨在让AI学习人类直觉。其技术已应用于机器人领域，让机器人在虚拟环境中习得技能后迁移到现实。投资人包括软银、微软等，投后估值约60亿美元。

行业 General Intuition Fortnite 机器人智能体融资

推荐理由：General Intuition用游戏数据训AI机器人，刚融了3.2亿，和普通算法训练思路不一样，感兴趣可以看看。

原文

6月25日

22:54

22:54IT之家（博客/媒体）

2025年中国具身智能市场规模约9150亿元，预计2026年将达10904亿元。全国具身智能相关企业数量已突破万家。链博会展示了从核心零部件到整机系统的产业闭环。国家发改委表示将加快训练基础设施建设，推进具身智能进入工厂、商场和家庭。教育部2026年本科专业目录新增具身智能等专业。

行业具身智能机器人市场规模政策产业链

推荐理由：市场规模已经9150亿了，年底就要破万亿，而且国家在推、大学在开专业，这赛道真的起飞了。

原文

16:21

Pandaily@contact@pandaily.com (Pandaily)

RoboScience推出Visics，一个跨平台具身AI模型，能泛化到不同机器人、物体和任务。该模型基于端到端架构，在模拟和真实环境中均表现优越。实验显示，Visics在多种操作任务上成功率超过85%，远超现有基线方法。

AI模型 Visics RoboScience 具身智能机器人通用模型

推荐理由：RoboScience出了个Visics模型，能跨不同机器人干活，不用每换一种就重新训练，有点意思。

原文

10:59

arXiv cs.AI@Shuyi Zhang, Yunfan Lou, Hongyang Cheng, Yichen Guo, Chuyao Fu, Yaoxu Lyu, Xiaojie Zhang, Haoran Li, Pengwei Wang, Zhongyuan Wang, Shanghang Zhang

FORCE是一个三阶段框架，通过价值校准热身和自蒸馏来稳定VLA模型的强化学习微调。它解决了Q函数不稳定导致的初期遗忘和低质量探索数据导致的策略更新低效问题。在模拟和真实任务上，FORCE取得了79%的绝对成功率提升，比此前RL方法高出10%，同时训练速度加快32.5%。该框架无需人工干预即可实现稳健性能。

AI模型 FORCE VLA 强化学习机器人

推荐理由：新框架FORCE让机器人学动作更快更稳，成功率飙升79%，比现有RL方法还快32.5%，不用人插手。

原文

09:21

09:21IT之家（博客/媒体）

智元联合创始人兼总裁彭志辉在MWC26上海主题演讲中指出，AI下一阶段核心是从数字世界走进物理世界，自主完成任务。他强调未来AI将持续运行、学习并创造生产力，行业将迈入具身智能规模化部署时代。彭志辉提到特斯拉计划年底实现数千台人形机器人量产，波士顿动力也转向商业落地价值挖掘。他提出XYZ曲线划分产业发展周期，其中Y曲线是部署成长期，机器人具备完整交互作业能力，大规模落地真实场景。

行业智元彭志辉 MWC26 具身智能机器人

推荐理由：智元总裁彭志辉在MWC26上说了大实话：资本不再为机器人炫技买单，得在工厂、仓库真干活才行。还提到特斯拉计划年底量产数千台人形机器人，波士顿动力都转商业化了。

原文

6月24日

12:07

12:07IT之家（博客/媒体）

软银集团董事长孙正义在股东大会上透露，公司已在一家工厂启动机器人量产，即将正式发布。他表示软银将通过整合垂直领域顶尖机器人企业，成为“压倒性世界第一的机器人公司”。软银计划于2026年完成对瑞士ABB旗下机器人业务的收购，该交易金额近54亿美元（约367亿元人民币）。软银曾于2017年收购波士顿动力，但2021年起陆续出售其股权。

行业软银孙正义机器人 ABB 量产

推荐理由：孙正义说软银已经在工厂量产机器人了，还要收购ABB机器人业务，目标是世界第一，机器人赛道要变天了。

原文

11:58

arXiv cs.LG@Maggie Wang, Lars Osterberg, Stephen Tian, Ola Shorinwa, Jiajun Wu, Mac Schwager

InSight框架通过将VLA模型在原始动作层面变得可操控，从而解锁自主技能获取能力。该框架包含自动分割管道，利用VLM计划分解和末端执行器姿态将演示分割成带标签的原始动作，以及VLM引导的数据飞轮，自动识别缺失原始动作并尝试演示。在模拟和真实世界操作任务中（包括方块翻转、抽屉关闭、清扫、扭转、倒水）评估，无需任何人工演示即可学习这些技能。学到的原始动作可组合执行新颖的长周期任务，无需额外人工演示。

论文 InSight VLA 操作技能自主学习机器人

推荐理由：这篇论文提出了InSight框架，让机器人通过VLA模型自己学新技能，不用人教，就能搞定方块翻转、倒水这些操作，很有实用性。

原文

10:24

量子位@贾浩楠

高通将智能座舱芯片优势延伸至物理AI领域，主打边缘智能而非极致算力。该公司提出“不争最强算力，只求无处不在”的策略，瞄准机器人和自动驾驶场景。这一转型可能改变市场对高通的估值逻辑，从汽车娱乐芯片转向物理世界智能计算平台。

行业高通智能座舱物理AI 机器人行业转型

推荐理由：高通原来做座舱芯片很强，现在要搞机器人AI，和英伟达、特斯拉的竞争格局要变了，值得关注。

原文

6月23日

13:33

arXiv cs.LG@Mingi Choi, Gunhee Kim, Jisoo Kim, Taeksoo Kim, Taeyun Ha, Jongbin Lim, Hanbyul Joo

AutoDex是一个自动化真实世界数据收集系统，用于灵巧抓取。它利用20个摄像头在严重手-物遮挡下定位物体，执行碰撞监控的运动，标记抓取成功或失败，并主动重置物体。在100个不同物体上使用Allegro和Inspire手收集了3,593次抓取试验。与遥操作相比，处理500次轨迹只需10.3小时（遥操作49.4小时），吞吐量提升4.8倍。从AutoDex验证数据库检索的抓取成功率为76%，而仅模拟验证为34%。

论文 AutoDex 灵巧抓取机器人多视角感知自动化数据收集

推荐理由：AutoDex自动搞定灵巧抓取数据收集，比遥操作快4.8倍，成功率碾压纯模拟验证

原文

13:02

arXiv cs.AI@Ulas Berk Karli, Tesca Fitzgerald

论文提出RECALL方法，用于视觉-语言-动作（VLA）模型的主动持续学习。与被动模仿学习相比，不确定性引导的数据收集使微调效率提升30%以上。但仅训练恢复数据会导致灾难性遗忘，在OpenVLA模型上丢失20%的旧任务性能。评估了重放混合和弹性权重巩固（EWC）两种持续学习技术，发现可塑性与记忆保留之间存在权衡。实验在3个机器人操作任务上进行，表明不确定性引导的恢复演示能提升适应效率，但如何平衡新旧知识仍是开放挑战。

论文 VLA RECALL 主动学习持续学习机器人

推荐理由：这篇论文研究了怎么让机器人在学新任务时不忘旧技能，用不确定性主动挑数据微调VLA模型，比被动收集更高效，还试了两种防遗忘方法，挺实在的。

原文

6月21日

19:23

量子位@鱼羊

2026年上半年，具身智能赛道融资额已接近去年全年水平。超过一半的资金流向了机器人“大脑”相关的模型与算法研发。这表明行业正集中资源攻克智能体的核心能力。

行业具身智能融资机器人 2026

推荐理由：今年具身智能融资太火了，一半钱都砸向机器人脑子，值得看看钱去哪了

原文

6月19日

00:02

Gary Marcus@GaryMarcus

精选

Gary Marcus引用Matei Zaharia的研究，神经符号系统在机器人领域击败当前最优方法。该方法采用AI驱动的搜索（类似GEPA的方法），让AI生成AI与代码的混合体。Zaharia认为这类系统效率很高，并在其他应用中也观察到类似效果。该成果展示了神经符号系统在控制与规划方面的优势。

AI模型 Neurosymbolic Systems GEPA Robotics AI Search 机器人

推荐理由：Gary Marcus分享了Matei Zaharia的神经符号系统研究，用AI搜索在机器人上打败了现有最优方案，值得搞机器人或符号推理的人关注。

原文

6月18日

13:58

13:58IT之家（博客/媒体）

76°

英伟达GEAR实验室联合负责人Jim Fan宣布首次在物理世界中启用AutoResearch。ENPIRE是编码智能体框架，将8个Codex智能体配备多个机器人、GPU分配和Token预算，设定任务目标。机器人学会寻找视觉线索、系扎带、整理钉子以及把显卡插到主板上。Jim Fan表示机器人可整夜自我改进，并计划开源该技术。

AI模型英伟达 ENPIRE Codex 机器人开源

推荐理由：英伟达的机器人自己学会了装显卡，还能整夜自我训练，以后在家也能托管一个机器人实验室了。

原文

10:08

Pandaily@contact@pandaily.com (Pandaily)

阿里巴巴发布Qwen-Robot具身AI模型系列，进军机器人领域。字节跳动将机器人业务提升为核心业务，两大互联网巨头利用各自数据、AI大脑和场景优势重塑中国机器人行业。Qwen-Robot系列基于阿里通义千问大模型，支持多种机器人形态。字节跳动则通过其AI技术和应用场景推动机器人商业化。

行业 Alibaba ByteDance Qwen-Robot 具身智能机器人

推荐理由：阿里发了Qwen-Robot具身AI模型，字节把机器人当核心业务了。看互联网巨头怎么用数据和AI做机器人，和传统公司不一样。

原文

03:06

Jim Fan@DrJimFan

精选76°

Jim Fan揭秘了物理自动研究系统ENPIRE的设计内幕。安全采用两层硬编码：硬运动学限制立即触发任务失败并自动重置，以及扭矩限制柔性夹爪防止碰撞损坏。奖励函数通过收集成功/失败演示、用计算机视觉分类器编码并冻结在Gym环境中，防止智能体篡改。系统遥测定义了Mean Robot Utilization（MRU）、Mean Token Utilization（MTU）和GPU利用率三个实时指标，并基于Tokens-to-Success和Time-to-Success评估预算效率。

AI模型 ENPIRE 物理自动研究安全机制机器人奖励函数

推荐理由：Jim Fan讲了他们怎么让8个机器人通宵自动做实验，还防止奖励被篡改，资源利用率指标也很实用。

原文

02:14

Jim Fan@jimfan

76°

Jim Fan团队推出ENPIRE系统，让8个Codex智能体操控机器人舰队自主进行物理实验。系统硬编码两层安全机制：硬运动学限制和扭矩限制夹爪，防止机器人超出安全范围。通过人类演示几分钟成功/失败样本，智能体编写计算机视觉代码生成分类器作为冻结奖励函数。定义Mean Robot Utilization（MRU）和Mean Token Utilization（MTU）监控资源，以Tokens-to-Success和Time-to-Success衡量效率。

AI模型 ENPIRE Codex 机器人智能体安全

推荐理由：Jim Fan展示了ENPIRE，8个机器人靠Codex智能体自主做实验，安全机制和资源监控设计挺有意思。

原文

00:55

00:55Hugging Face: Blog（博客/媒体）

精选

Strands Agents与LeRobot结合，实现了从Hugging Face Hub加载预训练模型并直接部署到真实机器人硬件。该系统支持多种机器人平台，如Aloha和Franka，并提供了从仿真到现实的无缝映射接口。用户无需编写底层驱动即可运行来自Hub的模型，显著降低了机器人研究的硬件部署门槛。该方案已在Amazon实验室的多个机器人上测试成功，推动了开源机器人生态的发展。

AI产品 Strands Agents LeRobot Hugging Face Hub 机器人模型部署

推荐理由：想把你训练好的机器人模型直接跑上真实硬件？Hugging Face联合Amazon推出了Strands Agents，连接LeRobot，一键部署，省掉底层驱动烦恼。

原文

6月17日

23:33

23:33IT之家（博客/媒体）

精选

领益智造在北京亦庄的具身智能机器人超级工厂近日规模投用，是京津冀首个万台级工厂。该工厂覆盖从核心零部件到整机组装的全链条制造，采用力觉+视觉双引导精密装配，换型时间小于15分钟。整机环形吊轨测试线可同时承载6-12台机器人，动态验证性能边界，较传统线体节能约25%。工厂全站自研MES、WMS、QMS系统，实现全流程数字化追溯，可在24小时内完成质量闭环优化。规划年产能逐步爬坡，预计2030年达到50万台套。

行业领益智造具身智能机器人京津冀机器人智能体

推荐理由：领益智造在北京开了家能年产50万台具身机器人的大工厂，从零件到整机全包，还有自动测试线，想了解机器人量产进展的可以看。

原文

23:31

阿里云 Alibaba Cloud@alibaba_cloud

阿里云推出EdgeAgent Arena竞赛，旨在将Qwen模型应用于机器人及IoT设备。参赛者需构建通过边缘传感器感知并本地行动的硬件系统。竞赛总奖金超过70,000美元，注册现已开放。该活动鼓励利用Qwen在边缘场景中实现智能决策与本地执行。

行业 Qwen Alibaba Cloud EdgeAgent Arena 机器人边缘计算

推荐理由：阿里云搞了个比赛，用Qwen做边缘机器人，奖金7万美元，想动手的可以报名试试。

原文

23:30

Decoder@Maximilian Schreiner

73°

Nvidia、卡内基梅隆大学和UC Berkeley的研究人员使用AI编码智能体（coding agents）训练机器人自主完成灵巧抓取任务。项目部署了8台机器人，在真实世界中执行复杂抓取，成功率高达99%。该研究展示了AI智能体在机器人技能自我提升中的潜力。

AI模型 Nvidia AI编码智能体机器人灵巧抓取

推荐理由：Nvidia和大学团队让8台机器人用AI编码智能体自己练抓取，成功率冲到99%，比手写代码更灵活。

原文

23:17

AI Will@FinanceYF5

73°

NVIDIA在SIGGRAPH 2026上发布MotionBricks，该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟，让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计，能动态生成自然动作。

AI模型 MotionBricks NVIDIA 游戏角色机器人动作生成

推荐理由：NVIDIA搞了个MotionBricks，35万种动作技能随便切换，游戏角色和机器人动起来更自然了，比以前的方案快很多。

原文

10:46

arXiv cs.AI@Mingtong Zhang, Dhruv Shah

论文提出了VERITAS框架，将预训练通用机器人策略作为“生成器”，搭配无梯度的“视觉验证器”在推理时评估动作。该框架无需额外训练即可提升策略性能，优于原通用策略。使用验证的自主轨迹进行微调后，策略性能持续提升，且效率与专家演示相当，无需人工干预。实验表明推理时验证是一种实用且可扩展的部署改进机制。

论文 VERITAS 机器人推理时验证策略改进自主学习

推荐理由：这篇论文展示了如何用视觉验证器让机器人策略在推理时自我改进，无需额外训练，效率堪比专家演示，值得关注。

原文

10:10

pandaily@contact@pandaily.com (Pandaily)

73°

阿里巴巴发布了Qwen-Robot系列，这是其首个具身AI模型系列，涵盖导航、操作和世界建模三个领域。该系列可部署在Unitree Go2四足机器人上，仅需一个摄像头就能运行。Qwen-Robot模型旨在让机器人更智能地感知和交互物理世界。

AI模型 Qwen-Robot 阿里 Unitree Go2 具身AI 机器人

推荐理由：阿里给机器狗装上了AI大脑，单摄像头就能导航干活，Qwen-Robot系列挺实用。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

阿里巴巴Qwen团队推出Qwen-Robot Suite，将大语言模型能力扩展到物理世界。该套件使AI能够执行真实的机器人动作，而不仅仅是文本对话。更多演示视频可在官方博客qwen.ai/blog?id=qwen-r...查看。目前该推文获得63个点赞和5812次浏览。

AI模型 Qwen Qwen-Robot Suite 阿里巴巴机器人

推荐理由：Qwen机器人套件让AI从聊天变动手，看看它怎么在现实里干活

原文

03:03

berryxia@berryxia

73°

NVIDIA开源了SOMA-X v0.2，一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性，采用Apache 2.0许可证。它专为机器人和物理AI设计，可用于机器人训练、物理仿真和动作迁移，解决了不同机器人体型不统一导致动作数据难以复用的问题。

AI模型 SOMA-X NVIDIA 3D人体模型机器人物理AI

推荐理由：NVIDIA开源了SOMA-X v0.2，单一骨架就能适配不同体型，机器人动作数据复用门槛降低，训练效率提升。

原文

01:58

Jim Fan@jimfan

精选72°

ENPIRE赋予8个Codex智能体机器人集群和GPU资源，自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。

AI产品 ENPIRE Codex NVIDIA 智能体机器人

推荐理由：NVIDIA让8个AI智能体自己控制机器人干活，还能绑扎带装显卡，而且要开源，你可以在家搭机器人实验室了！

原文

01:57

Jim Fan@jimfan

76°

NVIDIA联合CMU和伯克利推出ENPIRE系统，让AI智能体完全自主控制真实机器人循环，包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化，无需人类介入。

AI模型 ENPIRE NVIDIA 机器人智能体自主循环

推荐理由：NVIDIA搞了个ENPIRE，让AI自己操控机器人反复试错，真实任务成功率干到99%，连GPU都能自己插。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

14:55

量子位@量子位的朋友们

阿里发布Qwen-Robot系列，包含Qwen-Robot-V1、Qwen-Robot-V1-Pro和Qwen-Robot-V1-Plus三款模型。该系列将视觉、语言与行动能力整合，支持在复杂环境中完成抓取、导航等任务。在RoboBench基准上，Qwen-Robot-V1-Pro任务成功率较基线提升15.3%。模型参数规模从7B到72B不等，可适配不同硬件平台。

AI模型 Qwen-Robot 阿里具身大模型机器人开源模型

推荐理由：阿里刚出的Qwen-Robot系列，三个模型从7B到72B，让机器人能边看边想边动，RoboBench成绩提升15%，搞具身智能的值得看看。

原文

12:23

12:23IT之家（博客/媒体）

阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列，包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld。这三个模型分别为机器人提供灵巧的手、认路的脚和会思考的大脑，可单独部署也能协同运转。此前，Qwen3.7-Max 在 Arena 全球大模型盲测中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产模型第一。

AI模型 Qwen-Robot 阿里巴巴具身智能 Qwen-RobotManip 机器人

推荐理由：阿里推出了首个具身智能模型系列 Qwen-Robot，包含操作、移动和世界模型，为机器人打造通用底座。

原文

01:06

Y Combinator@ycombinator

Hub 是一个通过全球贡献者网络采集真实世界数据的新平台。人类劳动力占全球GDP的一半，但绝大部分从未被记录。Hub 为前沿AI实验室和机器人公司开放访问这些难以获取的数据。该平台由 Y Combinator 支持，创始人 @xarmin 和 @tim404x 今日正式发布。

AI产品 Hub 训练数据数据采集 AI实验室机器人

推荐理由：Hub刚上线，它用全球贡献者网络帮你采集人类真实劳动力数据，解决AI训练数据稀缺问题。

原文

6月15日

11:12

arXiv cs.AI@Hongzhan Yu, Chenghao Li, Ruipeng Zhang, Henrik Christensen, Sicun Gao

生成式动力学模型用于机器人规划，但需可靠检测策略导致的分布外(OOD)转换。现有方法将动力学视为固定并附加后验支持代理，但当动力学对关键动作选择局部不敏感时可能失败。本文提出支持条件控制敏感性正则化，在训练区域促进对控制输入的敏感响应，同时限制弱经验支持下的不稳定外推。在视觉避障、操作和真实机器人导航实验中，该方法提升了OOD检测和闭环规划安全性。

论文 Sensitivity Shaping Latent Modeling OOD检测机器人动力学模型

推荐理由：新正则化法让机器人更安全

原文

6月13日

22:23

rohanpaul_ai@rohanpaul_ai

Sony AI开发的Ace机器人在国际乒联官方规则下击败了职业选手Miyuu Kihara。相关研究发表在《自然》杂志，论文标题为“Outplaying elite table tennis players with an autonomous robot”。该机器人展示了在动态对抗运动中超越人类精英的能力。

论文 Sony AI Ace Miyuu Kihara 机器人乒乓球

推荐理由：机器人赢了职业选手

原文

13:26

berryxia@berryxia

Aether AI创始人黄碧薇教授指出，当前视频生成模型仅学习“手靠近杯子时杯子会动”的相关性，而非因果机制。其团队benchmark显示，因果结构可使机器人任务成功率提升25-50%，样本需求降低5-10倍。在物理世界如机器人、自动驾驶中，相关性模型易产生危险幻觉，因果世界模型旨在让AI理解机制而非表象。

行业 Aether AI 因果模型机器人视频生成

推荐理由：黄碧薇讲透了AI在物理世界的短板

原文

6月12日

13:15

Physical Intelligence@physical_int

精选

Physical Intelligence 开发了一种强化学习（RL）方法，用于在数小时甚至数分钟内微调其模型以执行精确任务。该方法不训练整个模型，而是向最新模型 π-0.6 添加一个“RL token”输出，由小型 actor 和 critic 网络使用，通过 RL 快速学习。这大幅降低了模型微调的时间和计算成本，适用于机器人等需要快速适应新任务的场景。该技术有望加速 AI 在物理世界中的应用部署。

AI模型强化学习微调 π-0.6 机器人 Physical Intelligence

推荐理由：Physical Intelligence 的 RL 微调方法解决了模型适应新任务耗时长的痛点，做机器人或物理 AI 的团队可以大幅缩短部署周期，值得关注。

原文

13:14

Physical Intelligence@physical_int

精选

Physical Intelligence 为其机器人模型开发了一套记忆系统，结合了短期视觉记忆和长期语义记忆。该系统使机器人能够执行复杂的长任务，如清理厨房或从头制作烤奶酪三明治。这一突破解决了机器人长期任务执行中的记忆瓶颈，提升了自主性和实用性。

AI模型机器人记忆系统 Physical Intelligence 长期任务视觉记忆

推荐理由：机器人团队终于有了实用的记忆方案——短期视觉+长期语义让机器人能完成厨房清理、做三明治等长任务，做机器人开发的建议点开看看。

原文

13:14

Physical Intelligence@physical_int

Physical Intelligence公司提出，通用AI模型已驱动许多数字应用，而类似π0.6的“物理智能层”将推动物理世界的新应用。该公司已与多家企业合作，部署机器人执行实际任务。π0.6模型旨在为机器人提供通用智能，使其能适应复杂物理环境。这一进展标志着AI从数字领域向物理世界的扩展，有望加速机器人商业化应用。

AI模型 π0.6 物理智能机器人通用模型 Physical Intelligence

推荐理由：Physical Intelligence的π0.6模型正在将AI能力从数字世界延伸到物理世界，做机器人或自动化应用的团队值得关注——它可能成为机器人通用智能的基础层。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:05

Allen AI (Ai2)@allen_ai

精选

Allen AI 宣布其机器人基础模型 MolmoAct 2 在不到一个月内被下载超过 40 万次。现在他们开源了完整的代码和训练数据，允许开发者进行微调或在此基础上构建。这标志着机器人领域的一个重要开放资源，降低了进入门槛。

AI模型机器人开源/仓库基础模型微调 Allen AI

推荐理由：机器人开发者终于有了一个完全开源的基础模型可用，MolmoAct 2 的完整代码和数据让你可以直接微调或构建自己的机器人应用，值得立即尝试。

原文

10:53

arXiv cs.AI@Zhao-Heng Yin, Guanya Shi, Pieter Abbeel, C. Karen Liu

Mana 提出了一种将灵巧操作视为动画问题的 sim-to-real 框架，解决了铰接工具操作中协调内部自由度与接触交互的难题。该框架通过粗到细的流水线，将程序化生成的关键帧转化为操作轨迹，结合运动规划与强化学习实现零样本迁移。数据生成几乎全自动，每个工具仅需不到一分钟的鼠标点击指定功能属性。在四种不同铰接工具上，Mana 实现了零样本的 sim-to-real 抓取与手内操作，展示了可扩展的灵巧操作方案。

论文灵巧操作铰接工具 sim-to-real 强化学习机器人

推荐理由：铰接工具操作是机器人灵巧操作的硬骨头，Mana 用动画思路解决了数据生成和迁移难题，做机器人操作或 sim-to-real 的团队可以直接参考其零样本迁移方法。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？