表格基础模型注意力层的隐私漏洞与高风险查询保护

Privacy Vulnerabilities of Attention Layers in Tabular Foundation Models and Protection of High-Risk Queries

精选理由

这篇论文发现表格模型用上下文示例做推理时会泄露隐私,还提出了一个很有效的攻击和防御方法,干活不花哨。

AI 摘要

本文发现表格基础模型(Tabular Foundation Models)在推理时使用的上下文示例(context examples)通过注意力机制会泄露隐私。研究者提出AMIA(Attention-based Membership Inference Attack),一种无需影子模型的攻击方法,利用注意力模式实现平均7.7%的增益,尤其在低假阳性区域表现突出。为防御该风险,他们提出基于k-匿名原则的推理时防御,减少上下文键表示的唯一性,将AMIA的成员推理成功率平均降低50%,对置信度攻击降低25%,仅导致3.9%的性能下降。此外,实验表明微调会增加隐私风险,微调后置信度上升的样本更易受攻击。

AI 翻译 · 中文

本文发现表格基础模型(Tabular Foundation Models)在推理时使用的上下文示例(context examples)通过注意力机制会泄露隐私。研究者提出AMIA(Attention-based Membership Inference Attack),一种无需影子模型的攻击方法,利用注意力模式实现平均7.7%的增益,尤其在低假阳性区域表现突出。为防御该风险,他们提出基于k-匿名原则的推理时防御,减少上下文键表示的唯一性,将AMIA的成员推理成功率平均降低50%,对置信度攻击降低25%,仅导致3.9%的性能下降。此外,实验表明微调会增加隐私风险,微调后置信度上升的样本更易受攻击。

arXiv cs.AITabular foundation models are commonly assumed to present limited privacy concerns as they are often pre-trained on large collections of synthetic data. However, these models leverage in-context learning, where sensitive