利用适当评分规则进行时间序列数据集的模型选择研究

Model selection with proper scoring rules on data sets of time series

精选理由

这篇论文用M5竞赛数据测试了不同模型选择标准,发现短测试集时只有平均分靠谱。搞时间序列模型的人可以参考。

AI 摘要

该论文探讨了在多个时间序列数据集上,使用适当评分规则(如平均分、中位分、平均排名)进行概率模型选择时出现的冲突问题。研究发现,这些统计量产生冲突决策的原因是评分分布的偏态性。随着每个时间序列测试集增大,不同模型选择标准会逐渐收敛到相同结论;但对于短测试集,只有平均分能正确识别真实模型。论文基于间歇性时间序列(包括M5竞赛数据集)进行了实验验证,强调了大规模测试集的重要性。

AI 翻译 · 中文

该论文探讨了在多个时间序列数据集上,使用适当评分规则(如平均分、中位分、平均排名)进行概率模型选择时出现的冲突问题。研究发现,这些统计量产生冲突决策的原因是评分分布的偏态性。随着每个时间序列测试集增大,不同模型选择标准会逐渐收敛到相同结论;但对于短测试集,只有平均分能正确识别真实模型。论文基于间歇性时间序列(包括M5竞赛数据集)进行了实验验证,强调了大规模测试集的重要性。

arXiv cs.LGWe consider the problem of model selection between probabilistic models on data sets of time series. Chosen a proper scoring rule, we denote by the term \textit{score} the average value of the scoring rule on the test of