SenFlow：混合文档中AI生成文本的句间流建模检测

精选理由

这篇论文用SenFlow模型做混合人机文本检测，在MOSAIC基准上比现有方法高出4个多点的F1分数，还发现AI句子有长度特征。

AI 摘要

SenFlow将混合文档中的句子级AI文本检测重构为结构化预测问题，在图传播与线性链CRF基础上实现整文档级联合解码。MOSAIC基准包含16,000篇混合文档，由DeepSeek-V3.2和Kimi K2生成，并引入困惑度一致性过滤。在跨域迁移最难协议下，SenFlow平均Macro-F1比现有方法高出4.15个百分点。研究还发现，即使经困惑度过滤后，AI插入的句子长度仍存在生成器依赖的差距。

AI 翻译 · 中文

arXiv: DeepSeekSentence-level AI-generated text detection (S-AGTD) for hybrid documents, where humans and LLMs co-author one text, faces two gaps: existing methods classify each sentence in isolation, discarding inter-sentence dependen…

IT之家06-16 09:25原文
Sebastian Raschka06-18 19:09原文

阅读原文