全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月22日

11:08

11:08

arXiv cs.AI@Yu Tang, Muhammad Zakwan, Efe Balta, John Lygeros, Alisa Rupenyan

精选

该论文提出了一种基于事件的深度强化学习方法，用于解决柔性作业车间调度问题中随机订单到达的挑战。研究采用近端策略优化算法和轻量级多层感知机训练智能体，以最小化所有作业的总完成时间。智能体从一组成熟的调度规则中选择动作，状态表示直接从环境中获取。仿真结果表明，该方法在不同异质性和订单到达率的数据集上均优于任何单一调度规则，并且在数据集异质性高时表现尤为出色。

论文深度强化学习柔性作业车间调度随机订单到达近端策略优化调度规则

推荐理由：制造和物流领域的调度团队终于有了应对随机订单到达的实用方案——DRL 智能体比传统调度规则更灵活，尤其适合订单类型多样的场景，做生产排程优化的可以直接参考实验方法。