多智能体系统中的策略表示学习

OpenAI Blog 2018/06/17 07:00 论文

摘要

OpenAI 研究人员提出了一个通用框架，用于在多智能体系统中使用最少的交互数据学习智能体策略的表示，将该问题视为表示学习，并应用于竞争控制和合作通信环境。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:46

# 多智能体系统中的策略表示学习来源: https://openai.com/index/learning-policy-representations-in-multiagent-systems/ OpenAI ## 摘要对智能体行为进行建模是理解多智能体系统中复杂现象出现的核心。以往的智能体建模工作主要是针对特定任务的，并且由手工设计的领域特定先验知识驱动。我们提出了一个通用学习框架，用于使用少量交互数据对任何多智能体系统中的智能体行为进行建模。我们的框架将智能体建模视为一个表示学习问题。因此，我们构建了一个受模仿学习和智能体识别启发的新颖目标函数，并设计了一个无监督学习智能体策略表示的算法。我们在以下方面实证演示了所提框架的效用：(i) 一个具有挑战性的高维连续控制竞争环境，以及 (ii) 一个通信合作环境，在监督预测任务、无监督聚类和使用深度强化学习的策略优化方面的应用。

多智能体系统中的策略表示学习

相似文章

学习合作、竞争和沟通

学习交流

从动作引导中学习智能体策略

多智能体RL何时能提升LLM工作流？工作流、规模与策略共享的权衡

NeuroMAS：将多智能体系统视为具有联合强化学习的神经网络

提交意见反馈