10:47arXiv cs.AI@Giuseppe Gabriele, Fabio Pavirani, Seyed Soroush Karimi Madahi, Chris Develder一篇论文提出决策聚焦强化学习(DF-RL)框架,用于控制电动汽车充电,解决未知离开时间问题。该方法将预测器与充电策略进行端到端联合训练,相比不使用离开时间预测的RL方法,总奖励提升14%,未供应能量(因车辆提前离开导致充电失败)减少55%。实验基于历史数据模拟,验证了在不确定性下充电决策质量的改善。论文强化学习电动汽车充电预测器决策聚焦推荐理由:这个论文搞了个新训练方式,让预测器和充电策略一起优化,结果充电失败少了一半多,值得做RL调度的看看。原文