marl

#marl

HyPOLE: 部分观测下基于超属性引导的多智能体强化学习

arXiv cs.AI ↗ · 2026-07-01 缓存

HyPOLE提出了一种在部分可观测性下进行多智能体强化学习的框架，它通过HyperLTL时序逻辑进行超属性引导学习，并与集中训练分散执行（CTDE）集成，在SMAC、MessySMAC和WildFire基准测试上展示了优于基线的结果。

0 人收藏 0 人点赞

#marl

arXiv cs.AI ↗ · 2026-06-30 缓存

HiComm是一种面向合作多智能体强化学习的即插即用通信模块，它将消息嵌入到发送者的分层观测结构中，采用接收者驱动的查询和三阶段解码，可将通信量减少高达23倍。

0 人收藏 0 人点赞

#marl

arXiv cs.LG ↗ · 2026-05-20

介绍HPML，一种将多智能体系统的联合更新场投影到度量梯度分量上以稳定和改进多智能体强化学习的方法。它提供了理论保证，并在CTDE基准测试上展示了改进的稳定性和回报。

0 人收藏 0 人点赞

#marl

arXiv cs.AI ↗ · 2026-05-14 缓存

提出MAVIC，一种多智能体强化学习方法，在指令边界修正价值估计，以在遵循外部自然语言指令的同时保持基础任务性能。

0 人收藏 0 人点赞