11:08arXiv cs.AI@Yu Tang, Muhammad Zakwan, Efe Balta, John Lygeros, Alisa Rupenyan精选该论文提出了一种基于事件的深度强化学习方法,用于解决柔性作业车间调度问题中随机订单到达的挑战。研究采用近端策略优化算法和轻量级多层感知机训练智能体,以最小化所有作业的总完成时间。智能体从一组成熟的调度规则中选择动作,状态表示直接从环境中获取。仿真结果表明,该方法在不同异质性和订单到达率的数据集上均优于任何单一调度规则,并且在数据集异质性高时表现尤为出色。论文深度强化学习柔性作业车间调度随机订单到达近端策略优化调度规则推荐理由:制造和物流领域的调度团队终于有了应对随机订单到达的实用方案——DRL 智能体比传统调度规则更灵活,尤其适合订单类型多样的场景,做生产排程优化的可以直接参考实验方法。原文