09:22arXiv cs.LG@Eric Nalisnick, Chi Zhang, Sophia Qian, Yixin Wang精选这篇论文从统计校准的角度研究人类与AI的团队协作模型。假设团队由AI模型和人类组成,两者都基于特征空间的某种划分进行了校准,论文揭示了校准假设如何影响团队协作框架。研究考虑了两种框架:一是结合人类和模型的预测,二是将预测责任委托给人类或模型。理论和实验结果表明,现有的组合方法无法保持人类的校准程度;而委托方法虽然保留了预测者的校准,但将负担转移到了决定谁预测的拒绝元模型上。拒绝元模型需要足够精细的校准以定位每个成员的优越区域,这种需求随着人类专业知识的增加而增长,当人类依赖系统无法观察的信息时,这种校准变得不可实现。论文人机协作校准统计学习团队决策AI系统设计推荐理由:这篇论文为设计更可靠的Human-AI协作系统提供了理论基石,做AI系统设计或人机交互研究的团队值得关注,能帮你理解校准假设如何影响团队决策的可靠性。原文
11:13arXiv cs.LG@Yuchen Wu, Kangjie Zhou, Weijie Su精选本文研究了在结构化交互学习环境中,生成模型因反复使用其他模型生成的合成数据而导致性能退化(模型崩溃)的条件。作者用有向图形式化模型间的交互模式,发现模型崩溃的发生关键取决于交互图的拓扑结构。他们推导出模型崩溃发生的充要条件,并为线性回归和一般M估计器建立了有限样本和渐近理论保证。这项研究填补了此前仅关注单模型自训练而忽略多模型交互场景的空白。论文模型崩溃交互学习生成模型有向图统计学习推荐理由:做生成模型训练或数据增强的团队,这篇论文帮你搞清楚多模型交互时什么时候会踩坑——交互图拓扑是决定因素,值得仔细看看理论条件。原文