AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
AI 自动挑选的高价值内容
全部模型产品行业论文技巧
标签:通信协议×
5月19日
11:16
arXiv cs.LG@Sangjun Bae, Yisak Park, Sanghyeon Lee, Seungyul Han
精选67
多智能体强化学习(MARL)中,通信是缓解部分可观测性的关键,但现有方法常存在信息交换低效或状态信息不足的问题。研究者提出LMAC(LLM驱动的多智能体通信),利用大语言模型的推理能力设计通信协议,让所有智能体尽可能准确且一致地重构底层状态。LMAC通过显式的状态感知准则迭代优化协议,改善状态恢复并缩小智能体间的知识差异。在多个MARL基准测试中,LMAC显著提升了智能体间的状态重建质量,并在性能上大幅超越之前的通信基线方法。
论文多智能体强化学习LLM推理通信协议状态重建LMAC

推荐理由:做MARL研究的团队终于有了一个利用LLM推理能力来设计通信协议的实用方案,LMAC直接解决了部分可观测性下的信息瓶颈问题,值得在实验环境中试试。