差分隐私作为一种严格的隐私保护框架,近年来在机器学习、联邦学习和数据发布等领域得到广泛应用。其核心思想是通过向查询结果中添加精心校准的噪声,以数学方式保证单个数据点的隐私泄露风险可控,同时保留数据的统计可用性。
- 近期研究进展主要体现在以下几个方面:
- 模型无关推理与隐私保护:SharedRequest 提出一种面向大语言模型(LLM)的推理框架,通过用户请求间的隐私预算分配和共享噪声注入,在不牺牲模型效用的情况下保护用户查询隐私,适用于黑盒API场景。
- 异构联邦学习下的隐私优化:IntraShuffler 针对联邦学习中各客户端拥有不同隐私预算和敏感度的问题,提出一种异构差分隐私框架,通过本地混洗与自适应噪声机制,在保护隐私的同时提升了模型精度。
- 隐私审计与实用性改进:Lumberjack 改进了差分隐私随机森林的构建方法,利用树内重击(intra-tree perturbations)检测机制,在保持隐私预算不变的情况下显著提高了预测性能。
当前焦点在于平衡隐私保护强度与数据实用性之间的权衡。例如,多样性可检测性 提出一种单次运行隐私审计方法,通过改进金丝雀(canary)生成策略,更准确地检测差分隐私实现中的隐私泄露,但该方法也可能暴露过度的隐私预算信息。此外,北大数院苏炜杰加入OpenAI 反映了差分隐私人才正受到业界重视,尤其是在安全AI训练和推理中的实际部署。未来观察点包括:差分隐私在数据市场(如 CHRONOS 中的时序隐私协调)和多智能体系统(如 SS-ZKR 中的语义零知识路由)中的扩展应用,以及统计嵌入方法(如 统计嵌入)如何与差分隐私结合实现可解释的隐私保护数据检索。