论文精选

社交凝视一致性:AI生成图像检测的新语义线索

When Eyes Betray AI: Social Gaze Consistency as a Semantic Cue for AI-Generated Image Detection

精选理由

这篇论文为AI生成图像检测开辟了全新维度——从社交凝视一致性入手,解决了传统低级伪影检测在人物交互场景中的失效问题。做图像取证、内容安全或生成模型评估的团队值得关注,其跨架构泛化能力意味着可以直接应用于现有检测系统。

AI 摘要

该论文提出了一种名为“社交凝视一致性”的高层语义线索,用于检测AI生成的图像。与传统的基于低级伪影(如像素指纹、频率异常)的方法不同,该线索关注交互个体之间视线方向、头眼对齐和瞳孔位置的相互一致性。研究者通过构建受控诊断数据集、采用块组合字幕监督方法,并在多个架构上验证,证明该线索能有效提升检测性能,例如在FakeVLM模型上,COCOAI Interaction子集的平衡准确率从67.8%提升至71.5%。该方法在真实和伪造类别的召回率上同时提升,避免了“全预测为假”的偏差,且训练于单一修复模型(FLUX.1-Fill)后能泛化到多生成器场景。

AI 翻译 · 中文

该论文提出了一种名为“社交凝视一致性”的高层语义线索,用于检测AI生成的图像。与传统的基于低级伪影(如像素指纹、频率异常)的方法不同,该线索关注交互个体之间视线方向、头眼对齐和瞳孔位置的相互一致性。研究者通过构建受控诊断数据集、采用块组合字幕监督方法,并在多个架构上验证,证明该线索能有效提升检测性能,例如在FakeVLM模型上,COCOAI Interaction子集的平衡准确率从67.8%提升至71.5%。该方法在真实和伪造类别的召回率上同时提升,避免了“全预测为假”的偏差,且训练于单一修复模型(FLUX.1-Fill)后能泛化到多生成器场景。

arXiv cs.AIRecent generative models have largely closed the gap on low-level artifacts - pixel fingerprints, frequency anomalies, upsampling traces - particularly in person-centric and partial-edit settings where the manipulated re