11:13arXiv cs.LG@Kareem Amin, Rudrajit Das, Alessandro Epasto, Adel Javanmard, Dennis Kraft, Mónica Ribero, Sergei Vassilvitskii该论文提出一个可定制的实证审计框架,用于检测合成数据中的隐私泄露。框架区分“真泄露”(系统直接复制用户信息)与“幻影泄露”(偶然生成用户数据)。通过将数据分为训练集和留出集,并应用统计假设检验,可判断泄露是否超出零学习或差分隐私基线。该方法无需模型访问、无需插入蜜罐、无需训练参考模型,仅需合成输出和留出控制集。实验表明,它作为成员推理攻击,能提供比传统数据审计方法更紧的隐私泄露下限,且计算资源需求少几个数量级。论文合成数据隐私审计差分隐私成员推理攻击LLM推荐理由:想审计合成数据是否偷学了你的信息?这篇论文给出了一个轻量级方案,无需模型权限,只需输出和留出集就能揪出隐私泄露。原文
10:51arXiv cs.LG@Mathieu Dagréou, Aurélien Bellet精选该论文研究了机器学习模型隐私审计中的金丝雀(canary)生成问题,旨在通过单次训练运行高效评估隐私泄露。作者提出一种结合影响函数贪婪初始化与双层优化的方法,生成既高可检测又低干扰的金丝雀,通过促进嵌入空间多样性减少金丝雀间干扰。实验表明,该方法在更低计算成本下获得比现有方法更强的隐私泄露估计,为差分隐私审计提供了实用改进。论文隐私审计差分隐私金丝雀生成双层优化影响函数推荐理由:做隐私审计或差分隐私研究的团队,这篇论文直接解决了单次运行审计中金丝雀干扰的痛点,提出的方法计算效率高且效果更好,值得点开看具体实现。原文