Safe-RULE：离线安全强化学习的数据毒化防御新框架

精选理由

做安全强化学习或机器人系统的团队，终于有了一个不用重训模型就能清理毒化数据的方案，值得关注。

AI 摘要

离线安全强化学习（Safe RL）依赖静态数据集，容易遭受数据毒化攻击——攻击者注入恶意样本导致策略不安全。本文提出Safe-RULE（安全强化反学习）框架，无需从头重新训练或访问原始训练环境，即可移除毒化数据的影响。该方法在反学习过程中同时考虑任务性能和安全约束，实验表明能有效提升对数据毒化攻击的安全性。

AI 翻译 · 中文

arXiv cs.LGOffline safe reinforcement learning (Safe RL) enables policy learning without online interactions, making it suitable for safety-critical systems such as robotics systems. However, its reliance on static datasets exposes…

阅读原文