IA-VQC-DPC:干预感知量子预测控制,量化安全归因

Who Earns the Safety? Intervention-Aware Quantum Predictive Control with Safety Attribution

精选理由

这篇论文解决了AI安全领域一个关键问题:如何区分策略本身的安全能力与外部过滤器的保护。做安全强化学习或控制系统的研究者值得关注,其安全归因协议可直接用于评估其他策略的真实安全性。

AI 摘要

该论文提出一种新的安全强化学习框架,旨在区分控制策略本身的安全性与外部安全过滤器的贡献。作者引入干预感知变分量子可微预测控制(IA-VQC-DPC),通过原对偶干预预算惩罚对可微控制屏障函数(CBF)投影的依赖,并设计安全归因协议来分解轨迹修正中的CBF项和运行时防护项。在BOPTEST建筑控制仿真中,干预感知训练显著降低了量子策略的原始违规率和安全层依赖,且未造成能量回归。在同等参数预算下,量子策略比经典策略更安全、更舒适。该归因协议具有通用性,不限于量子策略和建筑领域。

AI 翻译 · 中文

该论文提出一种新的安全强化学习框架,旨在区分控制策略本身的安全性与外部安全过滤器的贡献。作者引入干预感知变分量子可微预测控制(IA-VQC-DPC),通过原对偶干预预算惩罚对可微控制屏障函数(CBF)投影的依赖,并设计安全归因协议来分解轨迹修正中的CBF项和运行时防护项。在BOPTEST建筑控制仿真中,干预感知训练显著降低了量子策略的原始违规率和安全层依赖,且未造成能量回归。在同等参数预算下,量子策略比经典策略更安全、更舒适。该归因协议具有通用性,不限于量子策略和建筑领域。

arXiv cs.AIHard safety filters are increasingly placed downstream of learned controllers to guarantee constraint satisfaction at run time. Yet a filtered controller that never violates a constraint may still have learned nothing ab