11:50arXiv cs.LG@Giorgio Corani, Stefano Damato, Dario Azzimonti, Lorenzo Zambon该论文探讨了在多个时间序列数据集上,使用适当评分规则(如平均分、中位分、平均排名)进行概率模型选择时出现的冲突问题。研究发现,这些统计量产生冲突决策的原因是评分分布的偏态性。随着每个时间序列测试集增大,不同模型选择标准会逐渐收敛到相同结论;但对于短测试集,只有平均分能正确识别真实模型。论文基于间歇性时间序列(包括M5竞赛数据集)进行了实验验证,强调了大规模测试集的重要性。论文M5 competition适当评分规则时间序列模型选择概率模型推荐理由:这篇论文用M5竞赛数据测试了不同模型选择标准,发现短测试集时只有平均分靠谱。搞时间序列模型的人可以参考。原文
11:12arXiv cs.LG@Ines Nolasco, Jules Cauzinille, Marius Miron, Gagan Narula, Milad Alizadeh, Emmanuel Fernandez, Matthieu Geist, Ellen Gilsenan-McMahon, Olivier Pietquin, Emmanuel Chemla, Sara Keen本研究使用88个eGeMAPS特征,对六个分类群的生物声学嵌入进行线性与非线性回归探针,揭示模型编码的语音特征。结果显示没有单一模型能覆盖全部特征空间,拼接嵌入性能最佳。Loudness特征编码最好(R²=0.76),F0最难恢复(R²=0.33)。通过交叉引用可恢复性与特征显著性(NMI),为模型选择提供数据驱动指导。论文bioacousticseGeMAPS语音特征模型选择可解释性推荐理由:选模型?看这个研究原文