近期关于“扰动”(Perturbation)的研究集中在两个领域:多模态大模型的评测偏见与机器人扩散策略的微调。在模型评测方面,研究者发现现有基准存在对感知扰动的脆弱性,并提出通过奖励建模来缓解这一偏见,从而提升评测的鲁棒性(多模态大模型评测偏见:Perceptual Perturbation 与 Reward Modeling 缓解方案)。另一方面,在机器人操控中,一种轻量级扩散策略微调方法(LP-DS)通过引入受控扰动来增强策略的多样性和鲁棒性,从而提高强化学习效率(LP-DS:轻量级扩散策略微调方法,提升机器人操控与强化学习效率)。此外,在稀疏自编码器的基准测试中,研究者指出SAEBench的两项核心指标可能因扰动设置不当而失效,引发了关于评测可靠性的争议(稀疏自编码器基准测试可靠吗?SAEBench 两项核心指标被指失效)。当前焦点在于如何设计合理的扰动机制,既能暴露模型不足,又不导致评测失效;未来观察点是扰动在模型训练与评测中的统一理论框架。
№perturbation·general
Perturbation
别名
- 首次出现
- 2026-05-22
- 最近出现
- 2026-06-02
- 累计提及
- 7
§ 01综述
§ 02相关报道03 条在档
§ 03邻近话题