Perturbation

§ 01综述

近期关于“扰动”（Perturbation）的研究集中在两个领域：多模态大模型的评测偏见与机器人扩散策略的微调。在模型评测方面，研究者发现现有基准存在对感知扰动的脆弱性，并提出通过奖励建模来缓解这一偏见，从而提升评测的鲁棒性（多模态大模型评测偏见：Perceptual Perturbation 与 Reward Modeling 缓解方案）。另一方面，在机器人操控中，一种轻量级扩散策略微调方法（LP-DS）通过引入受控扰动来增强策略的多样性和鲁棒性，从而提高强化学习效率（LP-DS：轻量级扩散策略微调方法，提升机器人操控与强化学习效率）。此外，在稀疏自编码器的基准测试中，研究者指出SAEBench的两项核心指标可能因扰动设置不当而失效，引发了关于评测可靠性的争议（稀疏自编码器基准测试可靠吗？SAEBench 两项核心指标被指失效）。当前焦点在于如何设计合理的扰动机制，既能暴露模型不足，又不导致评测失效；未来观察点是扰动在模型训练与评测中的统一理论框架。

§ 02相关报道03 条在档

§ 03邻近话题