opponent-modeling

标签

Cards List
#opponent-modeling

多智能体协商中基于对手建模的偏好估计

arXiv cs.CL · 2026-04-20 缓存

本文提出了一种新颖的偏好估计方法,将大型语言模型(LLM)的自然语言信息集成到结构化贝叶斯对手建模框架中,用于多智能体协商。该方法利用LLM从话语中提取定性线索,并将其转换为概率格式,在多方协商基准上展示了改进的协议达成率和偏好估计准确性。

0 人收藏 0 人点赞
#opponent-modeling

具有对手学习感知的学习

OpenAI Blog · 2017-09-13 缓存

OpenAI 提出了 LOLA (Learning with Opponent-Learning Awareness),一种多智能体强化学习方法,其中智能体能够塑造其他智能体的预期学习过程。该方法展示了在重复囚徒困境中合作的涌现现象,以及在博弈论设置中收敛到纳什均衡。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈