10:51arXiv: Google DeepMind@Junjian Zhang, Hao Tan, Ruonan Li, Dong Zhu, Aiping Li, Zhaoquan GuARB4WM提出一个统一的评估框架,用于测试世界模型在视觉扰动下的对抗鲁棒性。该框架定义了五个白盒损失目标,涵盖策略、价值和潜在动力学三个层面。在MetaWorld和DeepMind Control Suite的20个任务上评估了四种Dreamer-style代理。结果显示,针对值估计、潜在表示和RSSM动力学的攻击与直接策略破坏同等有害,早期或频繁扰动尤其严重。代码已开源并提供使用接口。AI模型ARB4WMDreamer世界模型对抗鲁棒性连续控制推荐理由:想检验你的世界模型扛不扛揍?ARB4WM这个新基准专门测视觉扰动下的鲁棒性,比单看动作空间全面多了。原文