利用适当评分规则进行时间序列数据集的模型选择研究

精选理由

这篇论文用M5竞赛数据测试了不同模型选择标准，发现短测试集时只有平均分靠谱。搞时间序列模型的人可以参考。

AI 摘要

该论文探讨了在多个时间序列数据集上，使用适当评分规则（如平均分、中位分、平均排名）进行概率模型选择时出现的冲突问题。研究发现，这些统计量产生冲突决策的原因是评分分布的偏态性。随着每个时间序列测试集增大，不同模型选择标准会逐渐收敛到相同结论；但对于短测试集，只有平均分能正确识别真实模型。论文基于间歇性时间序列（包括M5竞赛数据集）进行了实验验证，强调了大规模测试集的重要性。

AI 翻译 · 中文

arXiv cs.LGWe consider the problem of model selection between probabilistic models on data sets of time series. Chosen a proper scoring rule, we denote by the term \textit{score} the average value of the scoring rule on the test of…

阅读原文