AITOP6月11日 15:28
精选
过去 24 小时,从 865 条中筛出 48 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月9日
10:55
10:55
arXiv cs.AI@Haodi Hu, Chung-Ta Huang, Jing Liu, Ye Wang, Kei Suzuki, Matthew Brand, Toshiaki Koike-Akino
精选
推荐理由:做机器人操作策略的团队终于有了一个不重新训练就能处理故障的方案——ReCoVLA 用 VLM 做奖励选择器,零样本迁移到真实环境。做 VLA 策略部署的开发者可以直接参考这个框架。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月19日
12:46
12:46
arXiv: OpenAI@Benedict Florance Arockiaraj, Richard Chang, Wesley Yee
精选
推荐理由:做强化学习或自动驾驶的团队可以看看这篇——迁移学习让赛车智能体快速适应新赛道,模型方法收敛更快,值得一试。
