FACR: 反事实一致性动作单元因果推理实现忠实情绪解释

Faithful Action-unit Causal Reasoning for Counterfactually Faithful Emotion Explanations

精选理由

这篇论文提出了FACR方法,用反事实干预让模型解释情绪时真正依赖因果相关的动作单元,不再只是表面合理,在UNBC-PAIN上一致性从0.08跳到0.57。

AI 摘要

FACR将面部动作单元到情绪的推理建模为反事实一致性问题,提出基于独立诱导极性感知因果图G的训练目标。在UNBC-PAIN数据集上的主体无关评估中,该目标将调用动作单元与PSPI构造的一致性从基线0.08提升至0.57,代价是检测精度小幅下降。跨数据集七类情绪任务中一致性从0.50提升至0.84。通过将动作单元潜在激活与文本生成绑定,可实现语言解释的构造性忠实性,并迁移至第二套语言模型骨干。

AI 翻译 · 中文

FACR将面部动作单元到情绪的推理建模为反事实一致性问题,提出基于独立诱导极性感知因果图G的训练目标。在UNBC-PAIN数据集上的主体无关评估中,该目标将调用动作单元与PSPI构造的一致性从基线0.08提升至0.57,代价是检测精度小幅下降。跨数据集七类情绪任务中一致性从0.50提升至0.84。通过将动作单元潜在激活与文本生成绑定,可实现语言解释的构造性忠实性,并迁移至第二套语言模型骨干。

arXiv cs.LGMultimodal models can name the action units (AUs) behind a facial emotion, but their AU->emotion rationales are typically plausible rather than faithful: nothing forces the AUs a model invokes to be the AUs that actually