论文精选

READER:1.5B参数推理增强AI文本检测器,超越千倍大模型

READER: Reasoning-Enhanced AI-Generated Text Detection

精选理由

AI文本检测的可解释性和鲁棒性一直是痛点,READER用1.5B参数就超越了千倍大模型,做内容安全或反作弊的团队值得关注这个新思路。

AI 摘要

READER是一种新型AI文本检测方法,通过让模型在检测前生成结构化推理(rationale)来提升准确性和可解释性。它基于一个名为READ的监督数据集进行微调,该数据集包含人工标注的推理过程和判定结果。尽管只有1.5B参数,READER在分布内和分布外场景下均优于现有检测器,甚至超过GPT-5.2、Gemini-3-Pro和DeepSeek-V3.2等千倍规模的大模型。这项研究解决了AI文本检测中可解释性差和分布偏移下性能下降的关键问题。

AI 翻译 · 中文

READER是一种新型AI文本检测方法,通过让模型在检测前生成结构化推理(rationale)来提升准确性和可解释性。它基于一个名为READ的监督数据集进行微调,该数据集包含人工标注的推理过程和判定结果。尽管只有1.5B参数,READER在分布内和分布外场景下均优于现有检测器,甚至超过GPT-5.2、Gemini-3-Pro和DeepSeek-V3.2等千倍规模的大模型。这项研究解决了AI文本检测中可解释性差和分布偏移下性能下降的关键问题。

arXiv: DeepSeekRecent advances in large language models (LLMs) have made it increasingly difficult to distinguish human-written text from AI-generated content. Many existing detectors train supervised neural classifiers that achieve st