高效前瞻编码与抽象宽度：经典规划中通用策略学习的新方法

精选理由

经典规划研究者终于有了可扩展的通用策略学习方法——新方法解决了IW策略在大规模问题上的计算瓶颈，做AI规划或强化学习的团队可以直接参考其编码思路。

AI 摘要

该研究针对经典规划中的通用策略学习问题，改进了迭代宽度（IW）策略。现有IW方法在评估每个转移时计算成本高且表达能力有限，尤其在对象数量大时效率低下。作者提出两种改进：一是对整个搜索树进行高效整体编码，仅通过状态间的关系差异表示IW(1)可达状态，使关系图神经网络（R-GNN）能单次前向传播评分所有转移；二是定义抽象IW(1)，通过类型抽象原子进行新颖性检查，将缩放从原子数转向对象数。在IPC 2023基准测试和多个领域上，新方法达到了最先进性能，显著超越包括经典规划器LAMA在内的先前工作。

AI 翻译 · 中文

arXiv cs.AIGeneralized planning aims to learn policies that generalize across collections of instances within a classical planning domain. Recent Graph Neural Network (GNN) approaches have learned nearly perfect policies for severa…

阅读原文