11:07arXiv cs.LG@Shixiong Jiang, Taozheng Zhu, Fanxin Kong精选离线安全强化学习(Safe RL)依赖静态数据集,容易遭受数据毒化攻击——攻击者注入恶意样本导致策略不安全。本文提出Safe-RULE(安全强化反学习)框架,无需从头重新训练或访问原始训练环境,即可移除毒化数据的影响。该方法在反学习过程中同时考虑任务性能和安全约束,实验表明能有效提升对数据毒化攻击的安全性。论文安全强化学习数据毒化防御反学习离线RLSafe-RULE推荐理由:做安全强化学习或机器人系统的团队,终于有了一个不用重训模型就能清理毒化数据的方案,值得关注。原文