无需真实标注的量化可解释AI方法

精选理由

这项研究解决了XAI领域缺乏可靠评估标准的痛点，做模型可解释性研究的团队可以直接用这个指标来量化自己的方法，值得关注。

AI 摘要

可解释AI（XAI）技术对深度学习模型的验证和负责任使用日益重要，但缺乏可靠的评估标准。研究者提出了一种基于连续输入扰动的量化指标，用于衡量XAI方法的质量，该指标从充分性和必要性两个维度评估归因信息对模型决策的影响。实验表明，该指标比现有方法更符合人类对解释质量的直觉。基于此指标，团队还提出了一种新的XAI方法，通过可微分的近似指标作为监督信号微调模型，在不降低模型性能的前提下生成因果解释。该方法在多个量化指标上优于现有XAI技术。

AI 翻译 · 中文

arXiv cs.AIExplainable AI (XAI) techniques are increasingly important for the validation and responsible use of modern deep learning models, but are difficult to evaluate due to the lack of good ground-truth to compare against. We …

阅读原文