对抗鲁棒性在扰动类型间的迁移研究

精选理由

理解鲁棒性的跨扰动迁移机制，有助于设计更高效的对抗训练策略，减少对多种攻击类型单独训练的需求。

AI 摘要

OpenAI研究发现，针对一种扰动类型（如L-infinity）训练的对抗鲁棒模型，其鲁棒性可以迁移至其他未训练过的扰动类型（如L2或空间变换）。该发现揭示了对抗训练中鲁棒性泛化的内在机制，为构建更通用的安全AI系统提供了理论基础。

AI 翻译 · 中文