全部 AI 动态 · AI 热点

6月18日

10:24

10:24

arXiv: OpenAI@Yijin Wang, Shuyi Wang, Wenhan Zhang, Yuqi Ouyang

该论文提出了一个多领域基准数据集，包含8602张图像，覆盖商业海报、信息图、学术海报、收据、表格和UI截图6个类别，用于检测OpenAI的GPT Image 2生成的文本丰富图像。在零样本设置下评估了5种AI生成图像检测器，发现性能高度依赖领域：在部分类别表现好的方法在其他类别失败，且最强传统检测器对JPEG压缩敏感。此外，多模态视觉语言模型的初步评估显示其在结构化格式上既有潜力也有局限。

论文 GPT-Image-2 AI生成图像检测多领域基准文本丰富图像多模态检测

推荐理由：想测你手上的AI图片检测器靠不靠谱？这个基准有8602张图、6种类型，还试了5种检测器，发现它们碰上有文字的图片（比如收据、海报）就露馅，连JPEG压缩都扛不住。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月27日

10:31

10:31

arXiv cs.AI@Kim Jihyeon, Sohee Kim, Soosan Lee, Souhwan Jung, James Matthew Rehg, Hyesong Choi

精选

该论文提出了一种名为“社交凝视一致性”的高层语义线索，用于检测AI生成的图像。与传统的基于低级伪影（如像素指纹、频率异常）的方法不同，该线索关注交互个体之间视线方向、头眼对齐和瞳孔位置的相互一致性。研究者通过构建受控诊断数据集、采用块组合字幕监督方法，并在多个架构上验证，证明该线索能有效提升检测性能，例如在FakeVLM模型上，COCOAI Interaction子集的平衡准确率从67.8%提升至71.5%。该方法在真实和伪造类别的召回率上同时提升，避免了“全预测为假”的偏差，且训练于单一修复模型（FLUX.1-Fill）后能泛化到多生成器场景。

论文 AI生成图像检测社交凝视一致性语义线索 FakeVLM FLUX.1-Fill

推荐理由：这篇论文为AI生成图像检测开辟了全新维度——从社交凝视一致性入手，解决了传统低级伪影检测在人物交互场景中的失效问题。做图像取证、内容安全或生成模型评估的团队值得关注，其跨架构泛化能力意味着可以直接应用于现有检测系统。