ThinkDeception:渐进式强化学习框架实现可解释多模态欺骗检测

ThinkDeception: A Progressive Reinforcement Learning Framework for Interpretable Multimodal Deception Detection

精选理由

这个框架用MLLM和思维链一步步拆解欺骗线索,比黑箱模型更能解释为什么判定说谎,准确率还最高。

AI 摘要

ThinkDeception首次将多模态大语言模型(MLLM)引入欺骗检测领域,将其从二分类任务转变为显式认知推理过程。研究团队构建了首个逐步多模态思维链(CoT)数据集,并基于此开发基础模型ThinkDeception Base。核心创新是提出Visual-Audio Consistency Group Relative Policy Optimization(VAC-GRPO),采用渐进式训练将数据分为四个难度层级。在主流基准上,ThinkDeception在检测准确性和推理质量上达到新SOTA。

AI 翻译 · 中文

ThinkDeception首次将多模态大语言模型(MLLM)引入欺骗检测领域,将其从二分类任务转变为显式认知推理过程。研究团队构建了首个逐步多模态思维链(CoT)数据集,并基于此开发基础模型ThinkDeception Base。核心创新是提出Visual-Audio Consistency Group Relative Policy Optimization(VAC-GRPO),采用渐进式训练将数据分为四个难度层级。在主流基准上,ThinkDeception在检测准确性和推理质量上达到新SOTA。

arXiv cs.AIMultimodal deception detection is critical for identifying fraudulent intentions, yet existing approaches predominantly rely on end to end black--box paradigms. These methods suffer from a severe lack of interpretability