10:27arXiv cs.AI@Lezhi Tan, Tijana Zrnic该论文提出了一种名为“任务可交换性”的统计条件,允许研究人员在合成数据存在偏差和噪声的情况下,仍能进行具有可证明有效性的推断。核心思想是:如果当前研究任务与某些已有真实数据的“历史任务”在数学上可交换,那么就可以利用合成数据来扩展研究,同时保证统计结论的可靠性。作者在公众舆论调查(使用“硅样本”)和AI评估(使用自动评分器)两个场景中验证了该框架。这项工作为社会科学、AI评测等领域安全使用合成数据提供了理论基础。论文合成数据统计推断任务可交换性AI评估社会科学推荐理由:合成数据在科研中越来越常见,但偏差问题一直让人头疼。这篇论文给出了一个可操作的统计框架,让做社会科学调查或AI评估的研究者可以放心地用合成数据做推断,值得关注。原文