模型驱动方法开发强化学习环境家族

A Model-Driven Approach for Developing Families of Reinforcement Learning Environments

精选理由

这篇论文提出用模型驱动和遗传算法自动生成RL环境变体,省去手写大量相似环境的麻烦,野火场景验证过,做课程学习的可以看看。

AI 摘要

论文提出基于模型驱动的方法,通过混合遗传算法(结合全局搜索和启发式局部搜索)自动生成多组相似但不同的强化学习训练环境。方法将变异和约束表达为模型变换,由先进模型变换引擎操作化搜索过程。在野火缓解场景和课程学习(依赖环境家族的学习范式)中验证了方法的有效性。原型工具将手工开发环境家族的错误率降低,提升了可扩展性。

AI 翻译 · 中文

论文提出基于模型驱动的方法,通过混合遗传算法(结合全局搜索和启发式局部搜索)自动生成多组相似但不同的强化学习训练环境。方法将变异和约束表达为模型变换,由先进模型变换引擎操作化搜索过程。在野火缓解场景和课程学习(依赖环境家族的学习范式)中验证了方法的有效性。原型工具将手工开发环境家族的错误率降低,提升了可扩展性。

arXiv cs.LGVirtual training environments are software-intensive systems in which reinforcement learning (RL) agents learn, adapt, and demonstrate meaningful behavior. Virtual training environments offer a safe and cost-efficient al