11:04arXiv cs.LG@Clément Elliker, Mathis Le Bail, Clément Mantoux, Jesse Read, Sonia VanierRIDE 是一个针对铁路延误预测的开放数据集与基准,覆盖比利时全国铁路网,包含 9450 万次列车事件、360 万次行程和 3570 万条天气记录(2023-2025 年)。它标准化了预测任务、训练测试数据及评估协议,支持模型间直接比较。基于该基准,研究首次全面对比了非学习、统计学习和深度学习模型,发现图神经网络平均表现最佳,但最强学习模型间差距不大。该框架还提供按预测时长和延误变化的细分分析,有助于深入理解模型行为。论文铁路延误预测开放数据集基准测试图神经网络比利时铁路推荐理由:铁路延误预测终于有了标准化数据集和评估基准,做交通预测或时序建模的研究者可以直接用 RIDE 来测试和对比模型,省去自己收集数据的麻烦。原文