09:18arXiv cs.LG@Thodoris Lymperopoulos, Ioannis Kakogeorgiou, Denia Kanellopoulou精选XtrAIn 是一种新的特征归因方法,通过将遮挡操作从输入空间转移到参数空间,避免了传统遮挡方法中基线选择带来的偏差和分布外样本问题。它沿着模型训练轨迹,测量特征相关参数更新对输出 logits 的影响,从而生成更稳定、更可解释的归因图。实验在控制图像数据集和 PAM50 乳腺癌亚型分类上验证了其有效性。XtrAIn 还提供了轻量级近似 Xstep 和目标聚焦变体 XtrAIn+,以降低计算成本并增强类别特异性。该方法为理解模型训练过程中特征证据的形成提供了新视角。论文特征归因可解释性遮挡方法训练引导XtrAIn推荐理由:XtrAIn 解决了传统遮挡归因方法中基线选择和归因偏移的痛点,做可解释 AI 研究的开发者可以直接用,生成更干净的归因图,值得关注。原文
10:44arXiv cs.LG@Lianghuan Huang, Yihao Li, Saeed Salehi, Yingshan Chang, Ansh Soni, Konrad P. Kording精选该论文从信息论角度形式化了视觉中的“绑定问题”,即系统如何知道哪些特征(如颜色、形状)属于同一个物体。研究者提出了一种探测方法,用于测量深度学习模型(尤其是Vision Transformers)内部表示中的绑定信息。实验发现,ViT的不同组件(如[CLS]标记和空间标记)包含不同程度的绑定信息,且在特征共享、遮挡等挑战性场景中表现差异显著。这项工作表明,绑定信息是强视觉识别与推理的关键要素,但目前模型仍存在特征误归因的常见失败。论文绑定问题Vision Transformer信息论视觉推理特征归因推荐理由:做视觉AI的开发者会关心:你的ViT模型真的理解“蓝色圆形”是一个整体吗?这篇论文给出了量化绑定信息的方法,值得点开看看如何诊断模型的结构性盲点。原文
11:15arXiv cs.LG@Lanxin Xiang, Liang Shi, Youhui Ye, Boyu Jiang, Dawei Zhou, Feng Guo精选特征归因分析在解释机器学习模型时,常因数据分割、随机种子等随机因素导致结果不稳定。本文提出 RoSHAP 框架,通过 Bootstrap 重采样和核密度估计建模特征重要性得分的分布,并证明聚合得分渐近服从高斯分布,大幅降低计算成本。RoSHAP 指标同时奖励活跃、强且稳定的特征,在模拟和真实实验中优于单次归因方法。使用 RoSHAP 筛选的特征构建的模型,在预测性能接近全特征模型的同时,显著减少了特征数量。该框架提升了模型的可解释性和稳定性,为可靠的数据驱动决策提供了支持。论文特征归因SHAP鲁棒性模型可解释性Bootstrap推荐理由:做模型可解释性研究的团队终于有了一个能对抗随机波动的归因指标——RoSHAP 通过分布建模让特征排序更稳定,做特征筛选和模型审计的开发者可以直接用。原文