精选理由
想检验你的世界模型扛不扛揍?ARB4WM这个新基准专门测视觉扰动下的鲁棒性,比单看动作空间全面多了。
ARB4WM提出一个统一的评估框架,用于测试世界模型在视觉扰动下的对抗鲁棒性。该框架定义了五个白盒损失目标,涵盖策略、价值和潜在动力学三个层面。在MetaWorld和DeepMind Control Suite的20个任务上评估了四种Dreamer-style代理。结果显示,针对值估计、潜在表示和RSSM动力学的攻击与直接策略破坏同等有害,早期或频繁扰动尤其严重。代码已开源并提供使用接口。
AI 翻译 · 中文
ARB4WM提出一个统一的评估框架,用于测试世界模型在视觉扰动下的对抗鲁棒性。该框架定义了五个白盒损失目标,涵盖策略、价值和潜在动力学三个层面。在MetaWorld和DeepMind Control Suite的20个任务上评估了四种Dreamer-style代理。结果显示,针对值估计、潜在表示和RSSM动力学的攻击与直接策略破坏同等有害,早期或频繁扰动尤其严重。代码已开源并提供使用接口。
World models are widely used in robotic and agentic engineering control systems due to their ability to learn latent dynamics for planning and decision-making. As these systems are increasingly deployed in safety-critica…