6月11日
5月27日
10:52
10:52arXiv cs.LG@Lauren J Beesley, Alexander C Murph, Dave Osthus, Lauren A Castro
精选
该研究通过迁移学习,利用66种传染病的数据流训练预测模型,显著提升了20种疾病数据流的预测性能。研究发现,整合多数据流在84.9%的时间序列和模型结构中改善了预测效果,但数据质量至关重要,添加与目标数据差异过大的数据可能降低性能。研究者还公开了一个多疾病数据库,供传染病预测社区使用。
推荐理由:传染病预测模型常因数据单一而脆弱,这项研究用66种疾病数据做迁移学习,解决了数据短缺问题。做公共卫生预测或流行病建模的团队,可以直接用公开数据库试试。
5月21日
5月19日
11:09
11:09arXiv cs.LG@Bart Baesens, Andreas Goethals, Stefan Lessmann, Simon De Vos, Cristián Bravo, David Martens, Victor Medina-Olivares, Christophe Mues, Maria Oskarsdóttir, Seppe vanden Broucke, Tim Verdonck, Wouter Verbeke
精选
该论文系统评估了表格基础模型(tabular foundation models)在信用风险预测中的表现,涵盖违约概率(PD)和损失率(LGD)两大核心任务。研究发现,这些模型在多个数据集和实验条件下普遍优于梯度提升等传统方法,且在小数据集场景下提升尤为显著。模型无需超参数调优即可直接使用,降低了计算成本和部署门槛。这一发现对中小企业贷款、低违约组合等数据稀缺场景具有重要实践意义。
推荐理由:信用风险建模团队终于有了开箱即用的新选择——表格基础模型在小数据集上表现惊艳,做风控建模的可以直接拿来试试,省去调参烦恼。