10:16arXiv cs.LG@Khoat Than精选该论文给出No-Free-Fairness定理,指出学习系统中不公平的三个根本来源。首先,当任务在子组上存在不可约成本时,任何决策规则必须在整体性能与子组差异间权衡,形成固有的公平-成本边界。其次,即使在理想无噪声场景下存在完全公平且准确的解,有限样本学习也会导致子组间非平凡差异,且强制执行严格相对公平可能使达到低成本所需样本数呈指数增长。最后,模型类限制可独立引发差异:若模型无法表示某子组的准确解,则公平性无法通过数据或训练实现。论文AI公平性公平-准确性权衡统计学习理论子组差异推荐理由:这篇论文用数学证明了公平和准确不可兼得,小样本会让偏见更严重,模型表达能力不够也不行。做AI公平的人都会引用它。原文
11:11arXiv cs.LG@Abdellah Aznag, Rachel Cummings, Adam N. Elmachtoub本文研究多组均值估计主动学习的 max-risk 目标:在 d 个臂中分配 T 次采样以最小化最坏情况不确定性指数 max σ_k²/n_k。作者提出局部最小最大化框架,证明首个针对该目标的一般下界,将难度分解为预算项、异质性指数和模型相关复杂度度量 VLC。VLC 可重参为方差-费希尔信息,并为常见分布族给出闭式解。与现有上界对比,在广泛场景下接近最优(对数因子内),但高异质性实例存在系统差距。论文active learningmulti-group mean estimationVLC复杂度度量统计学习理论推荐理由:新复杂度指标VLC揭示主动学习难度来源原文
11:47arXiv cs.AI@Rustem Takhanov, Zhenisbek Assylbekov精选本文研究条件核岭回归(conditional KRR)的统计性质。该方法将经典线性回归(由函数类F指定特征)与标准KRR应用于残差部分相结合,可视为一种混合学习策略。理论结果表明,条件KRR可简化为使用残差核的标准KRR,代价是测试风险增加O(1/√N)项。当核K正定且F由前k个主特征函数或随机特征构成时,条件KRR优于标准KRR,尤其在回归函数的F分量比残差部分更显著时。实验验证了理论结论。论文核方法条件KRR核岭回归特征选择统计学习理论推荐理由:这篇论文为核方法注入可解释的线性特征提供了理论保障,做高维数据建模或核方法研究的团队值得关注,尤其适合处理特征显著但残差噪声小的场景。原文