14:34arXiv cs.AI@Amritpal Singh, Andrey Barsky, Mohamed Ali Souibgui, Ernest Valveny, Dimosthenis Karatzas精选可解释AI(XAI)技术对深度学习模型的验证和负责任使用日益重要,但缺乏可靠的评估标准。研究者提出了一种基于连续输入扰动的量化指标,用于衡量XAI方法的质量,该指标从充分性和必要性两个维度评估归因信息对模型决策的影响。实验表明,该指标比现有方法更符合人类对解释质量的直觉。基于此指标,团队还提出了一种新的XAI方法,通过可微分的近似指标作为监督信号微调模型,在不降低模型性能的前提下生成因果解释。该方法在多个量化指标上优于现有XAI技术。论文可解释AI量化评估因果解释模型微调深度学习推荐理由:这项研究解决了XAI领域缺乏可靠评估标准的痛点,做模型可解释性研究的团队可以直接用这个指标来量化自己的方法,值得关注。原文