LMAC：用LLM推理设计多智能体通信协议，提升MARL性能

精选理由

做MARL研究的团队终于有了一个利用LLM推理能力来设计通信协议的实用方案，LMAC直接解决了部分可观测性下的信息瓶颈问题，值得在实验环境中试试。

AI 摘要

多智能体强化学习（MARL）中，通信是缓解部分可观测性的关键，但现有方法常存在信息交换低效或状态信息不足的问题。研究者提出LMAC（LLM驱动的多智能体通信），利用大语言模型的推理能力设计通信协议，让所有智能体尽可能准确且一致地重构底层状态。LMAC通过显式的状态感知准则迭代优化协议，改善状态恢复并缩小智能体间的知识差异。在多个MARL基准测试中，LMAC显著提升了智能体间的状态重建质量，并在性能上大幅超越之前的通信基线方法。

AI 翻译 · 中文

arXiv cs.LGCommunication is a key component in multi-agent reinforcement learning (MARL) for mitigating partial observability, yet prior approaches often rely on inefficient information exchange or fail to transmit sufficient state…

阅读原文