multi-agent-rl

标签

Cards List
#multi-agent-rl

学习建模他人思维

OpenAI Blog · 2017-09-14 缓存

OpenAI 和牛津大学研究人员提出了 LOLA(Learning with Opponent-Learning Awareness),这是一种强化学习方法,使智能体能够建模并考虑其他智能体的学习,在迭代囚徒困境和硬币游戏等多智能体博弈中发现合作策略。

0 人收藏 0 人点赞
#multi-agent-rl

具有对手学习感知的学习

OpenAI Blog · 2017-09-13 缓存

OpenAI 提出了 LOLA (Learning with Opponent-Learning Awareness),一种多智能体强化学习方法,其中智能体能够塑造其他智能体的预期学习过程。该方法展示了在重复囚徒困境中合作的涌现现象,以及在博弈论设置中收敛到纳什均衡。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈