AITOP6月11日 15:28
精选
过去 24 小时,从 665 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月18日
10:37
10:37
arXiv cs.LG@Yifan Zhang, Liang Zheng
精选
推荐理由:做非平稳控制或鲁棒强化学习的团队终于有了一个理论扎实且可验证的方案——BAPR在稳定期和变化期之间自动平衡保守性,Lean 4形式化验证保证了可靠性,值得研究RL安全性的开发者点开。
