SenFlow:混合文档中AI生成文本的句间流建模检测

SenFlow: Inter-Sentence Flow Modeling for AI-Generated Text Detection in Hybrid Documents

精选理由

这篇论文用SenFlow模型做混合人机文本检测,在MOSAIC基准上比现有方法高出4个多点的F1分数,还发现AI句子有长度特征。

AI 摘要

SenFlow将混合文档中的句子级AI文本检测重构为结构化预测问题,在图传播与线性链CRF基础上实现整文档级联合解码。MOSAIC基准包含16,000篇混合文档,由DeepSeek-V3.2和Kimi K2生成,并引入困惑度一致性过滤。在跨域迁移最难协议下,SenFlow平均Macro-F1比现有方法高出4.15个百分点。研究还发现,即使经困惑度过滤后,AI插入的句子长度仍存在生成器依赖的差距。

AI 翻译 · 中文

SenFlow将混合文档中的句子级AI文本检测重构为结构化预测问题,在图传播与线性链CRF基础上实现整文档级联合解码。MOSAIC基准包含16,000篇混合文档,由DeepSeek-V3.2和Kimi K2生成,并引入困惑度一致性过滤。在跨域迁移最难协议下,SenFlow平均Macro-F1比现有方法高出4.15个百分点。研究还发现,即使经困惑度过滤后,AI插入的句子长度仍存在生成器依赖的差距。

arXiv: DeepSeekSentence-level AI-generated text detection (S-AGTD) for hybrid documents, where humans and LLMs co-author one text, faces two gaps: existing methods classify each sentence in isolation, discarding inter-sentence dependen