精选理由
这篇论文用SenFlow模型做混合人机文本检测,在MOSAIC基准上比现有方法高出4个多点的F1分数,还发现AI句子有长度特征。
SenFlow将混合文档中的句子级AI文本检测重构为结构化预测问题,在图传播与线性链CRF基础上实现整文档级联合解码。MOSAIC基准包含16,000篇混合文档,由DeepSeek-V3.2和Kimi K2生成,并引入困惑度一致性过滤。在跨域迁移最难协议下,SenFlow平均Macro-F1比现有方法高出4.15个百分点。研究还发现,即使经困惑度过滤后,AI插入的句子长度仍存在生成器依赖的差距。
AI 翻译 · 中文
SenFlow将混合文档中的句子级AI文本检测重构为结构化预测问题,在图传播与线性链CRF基础上实现整文档级联合解码。MOSAIC基准包含16,000篇混合文档,由DeepSeek-V3.2和Kimi K2生成,并引入困惑度一致性过滤。在跨域迁移最难协议下,SenFlow平均Macro-F1比现有方法高出4.15个百分点。研究还发现,即使经困惑度过滤后,AI插入的句子长度仍存在生成器依赖的差距。
Sentence-level AI-generated text detection (S-AGTD) for hybrid documents, where humans and LLMs co-author one text, faces two gaps: existing methods classify each sentence in isolation, discarding inter-sentence dependen…