全部 AI 动态 · AI 热点

6月17日

10:17

10:17

arXiv cs.LG@Haoqi Yuan, Zhixuan Liang, Anzhe Chen, Ye Wang, Haoyang Li, Pei Lin, Yiyang Huang, Zixing Lei, Tong Zhang, Jiazhao Zhang, Jie Zhang, Jingyang Fan, Gengze Zhou, Qihang Peng, Chenxu Lv, Xiaoyue Chen, An Yang, Fei Huang, Junyang Lin, Dayiheng Liu, Jingren Zhou, Chenfei Wu, Xiong-Hui Chen

83°

Qwen-RobotManip是基于Qwen-VL构建的视觉-语言-动作基础模型。它引入统一对齐框架，覆盖表示、运动和操作行为三个维度，使多源训练数据协调一致。通过人工到机器人的合成流水线，利用15种平台的示教数据，构建了约38,100小时的预训练语料。模型在RoboCasa365、LIBERO-Plus、EBench等OOD基准上显著优于先前最佳模型π0.5，并在AgileX ALOHA、Franka、UR、ARX等真实机器人平台上验证。

AI模型 Qwen-RobotManip Qwen-VL 机器人基础模型多模态零样本迁移

推荐理由：阿里Qwen团队这个机器人模型用开源数据和人类演示就能学，跨平台零样本操作，还在多个测试里碾压了π0.5，做机器人开发的别错过。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

10:55

10:55

arXiv cs.AI@Haodi Hu, Chung-Ta Huang, Jing Liu, Ye Wang, Kei Suzuki, Matthew Brand, Toshiaki Koike-Akino

精选

ReCoVLA 提出一种故障条件残差恢复框架，保持预训练 VLA 策略冻结，利用外部 VLM 推断故障模式和恢复阶段，并编译结构化奖励。该方法将高层故障理解与低层控制解耦，支持不同 VLA 策略。在短程、长程和接触密集操作任务中，ReCoVLA 平均成功率从基线 36.7% 提升至 66.7%，物理零样本迁移实验达 61.7%。

论文 VLA策略故障恢复奖励编译零样本迁移机器人操作

推荐理由：做机器人操作策略的团队终于有了一个不重新训练就能处理故障的方案——ReCoVLA 用 VLM 做奖励选择器，零样本迁移到真实环境。做 VLA 策略部署的开发者可以直接参考这个框架。

6月2日

11:16

11:16

arXiv cs.LG@Eduardo Sebastián, Adrian Pfisterer, Vito Mengers, Oliver Brock, Amanda Prorok

这篇论文提出了一种新的机器人学习框架，通过将策略分解为“世界因子”和“任务因子”来实现结构泛化。世界因子描述机器人和环境的固有属性，独立于任务意图；任务因子则定义任务逻辑。作者利用贝叶斯模型证据形式化了这种不对称性，并实例化为AICON图与学习策略的组合，梯度作为两个因子的接口。实验表明，该方法在异构机器人、环境和任务中优于端到端基线，能零样本泛化到分布外配置，并直接迁移到真实硬件。

论文机器人学习泛化世界模型任务分解零样本迁移

推荐理由：机器人学习领域长期面临泛化难题，这篇论文从结构分解入手给出了新解法。做机器人策略研究或部署的团队值得关注，零样本迁移到真实硬件意味着可以直接减少重复训练成本。

5月19日

12:46

12:46

arXiv: OpenAI@Benedict Florance Arockiaraj, Richard Chang, Wesley Yee

精选

该研究探索了深度强化学习中迁移学习的应用，通过在OpenAI赛车环境中训练智能体在一个赛道上，然后通过零样本迁移或微调在其他定制赛道上实现快速圈速。研究发现，基于模型的方法在性能和收敛速度上均优于无模型方法。迁移学习不仅提升了目标域的性能，还在学习过程中表现出高效性。

论文迁移学习深度强化学习赛车环境模型方法零样本迁移

推荐理由：做强化学习或自动驾驶的团队可以看看这篇——迁移学习让赛车智能体快速适应新赛道，模型方法收敛更快，值得一试。