arXiv cs.AI@Amin Farajzadeh, Melike Erol-Kantarci精选17针对6G超密集网络中同频干扰严重的问题,研究者提出了一种名为FedCritic的无服务器联邦多智能体演员-评论家框架,用于联合子载波调度和功率分配。该框架通过虚拟队列赤字权重强制执行长期服务质量约束,并利用基于干扰图的轻量级八卦参数平均来联邦化评论家网络,无需中央协调器即可实现稳定价值估计。仿真表明,在干扰密集的复用-1场景下,FedCritic相比非协调和集中式训练分散执行基线,显著提升了平均信干噪比、小区边缘速率、网络总速率和公平性,同时训练更稳定且协调开销更低。这项工作为6G分布式资源管理提供了一种高效、可扩展的解决方案。论文6G资源分配联邦学习多智能体强化学习OFDMA推荐理由:6G超密集组网中的干扰管理是业界难题,FedCritic用无服务器联邦学习解决了集中式训练的高开销问题,做无线资源调度和网络优化的研究者可以直接参考其轻量级协调方案。
arXiv cs.AI@Alexi Canesse, Benoît Goupil, Jesse Read, Sonia Vanier精选58多智能体强化学习(MARL)中,通信是实现协作的关键,但许多实际应用(如无人机群搜索救援)面临严重的带宽限制。现有通信架构通常将共享潜在表示同时用于策略执行和智能体间通信,导致减少消息大小会直接限制策略的潜在空间,造成性能显著下降。本文提出两个贡献:一是引入归一化的每智能体带宽预算 β,统一了稀疏性、轮次和消息维度;二是提出 SLIM 架构,将通信路径与策略的潜在表示解耦,从而隔离带宽对策略容量的影响。实验表明,SLIM 在多个部分可观测的 MARL 基准上达到最先进性能,并在带宽减少时仅出现轻微性能下降,展现出良好的可扩展性和鲁棒性。论文多智能体强化学习带宽约束通信解耦SLIM鲁棒性推荐理由:做多智能体系统或机器人集群的团队,终于有了一个能直接应对带宽瓶颈的架构——SLIM 解耦通信与策略,带宽砍半性能也不崩,值得在无人机或边缘设备场景里试试。
arXiv cs.LG@Sangjun Bae, Yisak Park, Sanghyeon Lee, Seungyul Han精选67多智能体强化学习(MARL)中,通信是缓解部分可观测性的关键,但现有方法常存在信息交换低效或状态信息不足的问题。研究者提出LMAC(LLM驱动的多智能体通信),利用大语言模型的推理能力设计通信协议,让所有智能体尽可能准确且一致地重构底层状态。LMAC通过显式的状态感知准则迭代优化协议,改善状态恢复并缩小智能体间的知识差异。在多个MARL基准测试中,LMAC显著提升了智能体间的状态重建质量,并在性能上大幅超越之前的通信基线方法。论文多智能体强化学习LLM推理通信协议状态重建LMAC推荐理由:做MARL研究的团队终于有了一个利用LLM推理能力来设计通信协议的实用方案,LMAC直接解决了部分可观测性下的信息瓶颈问题,值得在实验环境中试试。