arXiv cs.AI@Michael Aichmüller, Simon Ståhlberg, Martin Funkquist, Hector Geffner精选58该研究针对经典规划中的通用策略学习问题,改进了迭代宽度(IW)策略。现有IW方法在评估每个转移时计算成本高且表达能力有限,尤其在对象数量大时效率低下。作者提出两种改进:一是对整个搜索树进行高效整体编码,仅通过状态间的关系差异表示IW(1)可达状态,使关系图神经网络(R-GNN)能单次前向传播评分所有转移;二是定义抽象IW(1),通过类型抽象原子进行新颖性检查,将缩放从原子数转向对象数。在IPC 2023基准测试和多个领域上,新方法达到了最先进性能,显著超越包括经典规划器LAMA在内的先前工作。论文经典规划图神经网络迭代宽度抽象化通用策略学习推荐理由:经典规划研究者终于有了可扩展的通用策略学习方法——新方法解决了IW策略在大规模问题上的计算瓶颈,做AI规划或强化学习的团队可以直接参考其编码思路。