精选理由
这篇论文想办法解决交叉群体数据少导致的模型歧视,搞了个框架能平衡公平和成本,还告诉你修改多少数据能换多少公平。
该论文针对机器学习模型在种族和性别等交叉敏感属性上表现出的歧视问题,提出了一种扩展的偏差缓解框架。该框架引入覆盖约束,确保训练数据中交叉子群有足够代表性。通过将偏差缓解表述为整数线性规划,量化了公平性代价(最小数据修改成本作为公平容忍度的函数)。在公开数据集上的实验表明,该方法能在保留预测精度的同时,通过容忍小近似偏差提高数据效率,并满足覆盖约束对下游性能的保护。
AI 翻译 · 中文
该论文针对机器学习模型在种族和性别等交叉敏感属性上表现出的歧视问题,提出了一种扩展的偏差缓解框架。该框架引入覆盖约束,确保训练数据中交叉子群有足够代表性。通过将偏差缓解表述为整数线性规划,量化了公平性代价(最小数据修改成本作为公平容忍度的函数)。在公开数据集上的实验表明,该方法能在保留预测精度的同时,通过容忍小近似偏差提高数据效率,并满足覆盖约束对下游性能的保护。
Machine learning models have been shown to exhibit discriminatory outcomes or degraded performance for individuals at the intersection of multiple sensitive attributes, such as race and gender. This stems in part from tw…