arXiv cs.AI@Sining Ang, Yuguang Yang, Canyu Chen, Yan Wang精选67端到端自动驾驶规划器通常通过模仿单一记录轨迹来训练,但评估时却使用基于规则的规划指标(如安全性、可行性、进度和舒适度),导致训练与评估不匹配。CLOVER 提出了一种闭环价值估计与排序框架,采用轻量级生成器-评分器结构:生成器产生多样候选轨迹,评分器预测规划指标子分数进行排序。通过构建评估器过滤的伪专家轨迹和集合级覆盖监督,CLOVER 扩展了候选支持;并采用保守闭环自蒸馏优化生成器和评分器。在NAVSIM上,CLOVER 达到94.5 PDMS和90.4 EPDMS,创下新SOTA;在更具挑战的NavHard上获得48.3 EPDMS,匹配最强结果。论文自动驾驶端到端规划闭环价值估计NAVSIM生成器-评分器推荐理由:CLOVER 解决了自动驾驶规划中训练与评估不匹配的核心痛点,做端到端规划的研究者和工程师可以直接参考其生成器-评分器框架和闭环自蒸馏方法,有望提升实际部署中的规划鲁棒性。