arXiv cs.LG@Calvin Isley, Johann D. Gaebler, Sharad Goel精选37在招聘、大学录取等难以获得真实标签的领域,模型常依赖历史人工评估训练,但历史评估可能包含对特定群体的偏见。本文提出用专家定义的标准(评分嵌入)替代传统黑盒嵌入作为预测基础,使模型锚定在语义有意义的维度上,从而避免继承偏见。理论和实验证明,该方法在合理条件下能有效缓解标签偏差。在大型硕士项目申请数据集上,基于评分嵌入的模型减少了群体差异,同时提升了录取群体的整体质量。论文标签偏差可解释性公平性评分嵌入决策算法推荐理由:做公平性AI或高利害决策系统的团队,这篇给出了一个可落地的方案——用专家评分嵌入替代黑盒特征,既减少偏见又提升质量,值得细读。
arXiv cs.AI@Aditya Tanna, Nassim Bouarour, Mohamed Bouadi, Vinay Kumar Sankarapu, Pratinav Seth精选58表格基础模型在健康数据集上表现优异,但高推理成本和基础设施需求限制了实际应用。研究者提出通过知识蒸馏将预测能力转移至轻量表格模型,并针对上下文表格模型在推理时依赖训练集导致的上下文泄露问题,采用分层折叠教师标注策略。在19个医疗数据集、6个教师模型、4个学生模型家族及多教师集成实验中,蒸馏学生模型保留了教师AUC的至少90%,部分甚至超越教师,同时CPU推理速度提升至少26倍,且保持校准性和公平性。多教师平均并未持续优于最佳单教师。该研究为推理受限的健康场景部署高质量预测提供了可行路径。论文表格基础模型知识蒸馏健康数据推理效率公平性推荐理由:医疗AI团队终于有了低成本部署高精度表格模型的方案——蒸馏后模型保留90%性能且快26倍,做健康数据预测的开发者可以直接用。