11:08arXiv cs.AI@Hallah Shahid Butt, Qiong Huang, Gökhan Demirel, Kevin Förderer, Erfan Tajalli-Ardekani, Simnon Waczowicz, Luigi Spatafora, Veit Hagenmeyer, Benjamin Schäfer该论文提出了一种可解释的深度强化学习(XRL)框架,用于优化住宅建筑的能源管理,特别是配备光伏和储能系统的建筑。研究对比了在线策略(如A2C和PPO)与离线策略算法,发现前者在累积奖励和策略稳定性上更优。框架利用事后解释技术揭示黑箱模型的决策过程,不仅降低了电费,还提供了透明、可操作的见解。实验基于合成数据和德国KIT的Living Lab真实数据,验证了方法的有效性。论文深度强化学习可解释AI建筑能源管理储能优化PPO/A2C推荐理由:建筑能源管理团队终于有了可解释的AI方案——XRL框架在降低电费的同时让你看清决策逻辑,做楼宇自动化或智慧能源的开发者可以直接参考。原文
09:43arXiv cs.AI@Federica Tonti, Ricardo Vinuesa该研究提出结合多智能体深度强化学习(MARL)与可解释深度学习(XDL)的方法,用于减少壁面湍流中的阻力。通过SHAP归因分析,比较了三种奖励设计策略,其中基于摩擦系数和壁面压力波动组合的SHAP策略表现最佳,实现了34.44%的减阻率和34.01%的净节能率,且归一化输入功率仅0.43%。相比传统对抗控制,减阻和净节能分别提升49.41%和48.52%,同时将归一化执行成本从5.90%降至0.43%。分析表明,节能策略与压力门控执行一致,主要在壁面压力接近零时激活,时间尺度与近壁湍流结构寿命相当。论文深度强化学习可解释AI湍流减阻SHAP归因节能控制推荐理由:流体力学和AI交叉领域的研究者值得关注——该工作用可解释AI找到了湍流减阻的节能控制策略,比传统方法效率提升近50%,且执行成本降低一个数量级。原文
11:08arXiv cs.AI@Yu Tang, Muhammad Zakwan, Efe Balta, John Lygeros, Alisa Rupenyan精选该论文提出了一种基于事件的深度强化学习方法,用于解决柔性作业车间调度问题中随机订单到达的挑战。研究采用近端策略优化算法和轻量级多层感知机训练智能体,以最小化所有作业的总完成时间。智能体从一组成熟的调度规则中选择动作,状态表示直接从环境中获取。仿真结果表明,该方法在不同异质性和订单到达率的数据集上均优于任何单一调度规则,并且在数据集异质性高时表现尤为出色。论文深度强化学习柔性作业车间调度随机订单到达近端策略优化调度规则推荐理由:制造和物流领域的调度团队终于有了应对随机订单到达的实用方案——DRL 智能体比传统调度规则更灵活,尤其适合订单类型多样的场景,做生产排程优化的可以直接参考实验方法。原文
12:46arXiv: OpenAI@Benedict Florance Arockiaraj, Richard Chang, Wesley Yee精选该研究探索了深度强化学习中迁移学习的应用,通过在OpenAI赛车环境中训练智能体在一个赛道上,然后通过零样本迁移或微调在其他定制赛道上实现快速圈速。研究发现,基于模型的方法在性能和收敛速度上均优于无模型方法。迁移学习不仅提升了目标域的性能,还在学习过程中表现出高效性。论文迁移学习深度强化学习赛车环境模型方法零样本迁移推荐理由:做强化学习或自动驾驶的团队可以看看这篇——迁移学习让赛车智能体快速适应新赛道,模型方法收敛更快,值得一试。原文