09:18arXiv cs.LG@Thodoris Lymperopoulos, Ioannis Kakogeorgiou, Denia Kanellopoulou精选XtrAIn 是一种新的特征归因方法,通过将遮挡操作从输入空间转移到参数空间,避免了传统遮挡方法中基线选择带来的偏差和分布外样本问题。它沿着模型训练轨迹,测量特征相关参数更新对输出 logits 的影响,从而生成更稳定、更可解释的归因图。实验在控制图像数据集和 PAM50 乳腺癌亚型分类上验证了其有效性。XtrAIn 还提供了轻量级近似 Xstep 和目标聚焦变体 XtrAIn+,以降低计算成本并增强类别特异性。该方法为理解模型训练过程中特征证据的形成提供了新视角。论文特征归因可解释性遮挡方法训练引导XtrAIn推荐理由:XtrAIn 解决了传统遮挡归因方法中基线选择和归因偏移的痛点,做可解释 AI 研究的开发者可以直接用,生成更干净的归因图,值得关注。原文