opponent-modeling

#opponent-modeling

SOM：基于结构因果模型的LLM智能体结构化对手建模

arXiv cs.AI ↗ · 2026-05-11 缓存

本文介绍了结构化对手建模（SOM），这是一种利用结构因果模型将LLM智能体在多智能体环境中的对手表征与预测解耦的框架。该方法利用显式的因果结构而非隐式的上下文推理，提高了预测准确性和战略决策能力。

0 人收藏 0 人点赞

#opponent-modeling

arXiv cs.CL ↗ · 2026-04-20 缓存

本文提出了一种新颖的偏好估计方法，将大型语言模型（LLM）的自然语言信息集成到结构化贝叶斯对手建模框架中，用于多智能体协商。该方法利用LLM从话语中提取定性线索，并将其转换为概率格式，在多方协商基准上展示了改进的协议达成率和偏好估计准确性。

0 人收藏 0 人点赞

#opponent-modeling

OpenAI Blog ↗ · 2017-09-13 缓存

OpenAI 提出了 LOLA (Learning with Opponent-Learning Awareness),一种多智能体强化学习方法,其中智能体能够塑造其他智能体的预期学习过程。该方法展示了在重复囚徒困境中合作的涌现现象,以及在博弈论设置中收敛到纳什均衡。

0 人收藏 0 人点赞