论文精选

高效前瞻编码与抽象宽度:经典规划中通用策略学习的新方法

Efficient Lookahead Encoding and Abstracted Width for Learning General Policies in Classical Planning

精选理由

经典规划研究者终于有了可扩展的通用策略学习方法——新方法解决了IW策略在大规模问题上的计算瓶颈,做AI规划或强化学习的团队可以直接参考其编码思路。

AI 摘要

该研究针对经典规划中的通用策略学习问题,改进了迭代宽度(IW)策略。现有IW方法在评估每个转移时计算成本高且表达能力有限,尤其在对象数量大时效率低下。作者提出两种改进:一是对整个搜索树进行高效整体编码,仅通过状态间的关系差异表示IW(1)可达状态,使关系图神经网络(R-GNN)能单次前向传播评分所有转移;二是定义抽象IW(1),通过类型抽象原子进行新颖性检查,将缩放从原子数转向对象数。在IPC 2023基准测试和多个领域上,新方法达到了最先进性能,显著超越包括经典规划器LAMA在内的先前工作。

AI 翻译 · 中文

该研究针对经典规划中的通用策略学习问题,改进了迭代宽度(IW)策略。现有IW方法在评估每个转移时计算成本高且表达能力有限,尤其在对象数量大时效率低下。作者提出两种改进:一是对整个搜索树进行高效整体编码,仅通过状态间的关系差异表示IW(1)可达状态,使关系图神经网络(R-GNN)能单次前向传播评分所有转移;二是定义抽象IW(1),通过类型抽象原子进行新颖性检查,将缩放从原子数转向对象数。在IPC 2023基准测试和多个领域上,新方法达到了最先进性能,显著超越包括经典规划器LAMA在内的先前工作。

arXiv cs.AIGeneralized planning aims to learn policies that generalize across collections of instances within a classical planning domain. Recent Graph Neural Network (GNN) approaches have learned nearly perfect policies for severa