对手建模并非策略：LLM谈判者的局限

arXiv cs.AI 2026/05/19 04:00 论文

negotiation llm strategic-reasoning counterparty-modeling bargaining ai-agents

摘要

研究表明，LLM智能体在谈判中能够建模对手的偏好，但未能将这种知识转化为战略性讨价还价以改善结果，这限制了它们在多轮谈判中的有效性。

arXiv:2605.16575v1 公告类型：新摘要：谈判不仅需要推断对方想要什么，还需要利用这些信息在多轮中提出有利的报价和还价。我们研究了大型语言模型（LLM）智能体在受控的多属性议价环境中是否做到这一点。我们发现，当前的LLM智能体能够建模对手的偏好，但并未可靠地将该知识转化为战略性讨价还价。当获得谈判对手的偏好信息时，智能体能准确且在推理过程的早期进行建模，但这并不能可靠地改善知情方的结果。轮次层面的分析揭示了原因：智能体常常回应他们认为对手重视的内容，但并未始终将这些行动与自身高价值属性上的收益相匹配。总体而言，卖家更为迁就，且在信息不对称条件下，知情方往往做出补偿较弱的让步。由于智能体未能利用这一潜在的效用结构来获取战略优势，它们的最终协议很大程度上由表面上的起始锚点决定，而非实际的效用权重。最后，要求智能体在报价前明确陈述以让步换取互惠的交易，使得单个轮次看起来更具战略性，但最终未能提高最终协议的效率。

查看原文

查看缓存全文

缓存时间: 2026/05/19 06:34

# 大语言模型谈判者的局限性 来源：https://arxiv.org/html/2605.16575 ## 对手建模并非策略：大语言模型谈判者的局限性 ###### 摘要 谈判需要的不仅仅是推断对方想要什么：它需要在多轮交互中利用这些信息做出有利的报价和还价。我们研究了大语言模型（LLM）智能体在受控的多属性讨价还价环境中是否能够做到这一点。我们发现，当前的LLM智能体可以对对手的偏好进行建模，但不能可靠地将这些知识转化为战略性讨价还价。当谈判对手的偏好信息被提供时，智能体能够准确地对其建模，并能在推理痕迹的早期展示出来，然而这并不能可靠地改善信息持有方的结果。回合层面分析揭示了原因：智能体通常会根据他们对对手价值的判断做出回应，但未能始终如一地将这些行动与自身高价值属性上的收益结合起来。卖方总体上更倾向于让步，而在信息不对称的条件下，信息持有方往往做出补偿更弱的让步。由于智能体未能利用这种底层的效用结构来获取战略优势，它们的最终协议在很大程度上被表面层次的初始锚点所支配，而非实际的效用权重。最后，要求智能体在提出报价之前明确陈述"让步以换取互惠"的交易，虽然使个别回合看起来更具战略性，但最终未能提高最终协议的效率。 ## 1. 引言 谈判是社会战略智能的一个紧凑测试（Zhou 等人，2023 (https://arxiv.org/html/2605.16575#bib.bib40)）。要谈判得好，智能体不仅需要推断对方想要什么，还需要决定如何在一系列回合中利用这些信息来最大化自己的结果：做出哪些让步，保持哪些属性不变，以及要求什么回报。例如，了解对手的优先事项应该允许智能体在低成本属性上做出让步，以换取其自身最高优先级上的收益。因此，战略性地使用偏好信息不仅仅是识别对方想要什么：它意味着将这些知识转化为互惠的交换，从而改善自身的处境。这使得谈判成为区分大语言模型（LLM）中经常被混淆的两种能力的有效场景：*对手建模* 和 *策略性利用*（Zhao 等人，2024 (https://arxiv.org/html/2605.16575#bib.bib39)；Kosinski，2024 (https://arxiv.org/html/2605.16575#bib.bib37)）。关于对方偏好的信息只有在能够转化为更好的权变行为时才有帮助。本文的核心问题是当前的LLM智能体能否实现从对手建模到策略的转变。随着LLM越来越多地用于采购、合同、销售和组织协调（Song 等人，2026 (https://arxiv.org/html/2605.16575#bib.bib33)；Kirshner 等人，2026 (https://arxiv.org/html/2605.16575#bib.bib36)），仅仅识别对方的偏好是不够的。它必须在交互中将这些知识转化为有利的行动。一个能够理解对方但系统性地进行低效讨价还价的智能体，可能表面上看起来具备社交智能，但实际上在战略上脆弱且容易被利用。这个场景突显了LLM评估中的一个普遍问题：一个模型能够描述或推理任务相关变量的证据，不应被视为其也能在序列行为中有效使用该变量的证据（Huang 等人，2025 (https://arxiv.org/html/2605.16575#bib.bib38)）。在人类身上，这种推断通常是合理的。然而在LLM智能体中，这两种能力可能只是部分对齐的（Junqué de Fortuny 和 Cappelli，2025 (https://arxiv.org/html/2605.16575#bib.bib35)）。谈判提供了一个受控的环境来直接检验这一区别。

最近的研究已经证明，LLM可以参与谈判，对社会策略做出反应，有时在双边讨价还价或基准测试中能够实现强有力的最终结果（Deng 等人，2024 (https://arxiv.org/html/2605.16575#bib.bib25)；Bianchi 等人，2024 (https://arxiv.org/html/2605.16575#bib.bib24)；Fu 等人，2023 (https://arxiv.org/html/2605.16575#bib.bib23)；Hua 等人，2024 (https://arxiv.org/html/2605.16575#bib.bib26)；Liu 等人，2026 (https://arxiv.org/html/2605.16575#bib.bib27)；Zhu 等人，2025 (https://arxiv.org/html/2605.16575#bib.bib28)；Rana，2024 (https://arxiv.org/html/2605.16575#bib.bib42)；Lewis 等人，2017 (https://arxiv.org/html/2605.16575#bib.bib32)；Davidson 等人，2024 (https://arxiv.org/html/2605.16575#bib.bib31)）。但这些研究主要评估的是*达成了什么*协议（最终价格、成交率、福利，或对效率和公平的广泛衡量），而不是智能体能否系统地利用优势（如信息不对称）来确保更优的个人结果。由于关注点主要集中在这些最终状态上，对于LLM智能体*如何*在多个回合中使用信息，我们知之甚少。特别是，先前的研究并未区分LLM智能体是否会将关于对手偏好的明确知识转化为在谈判过程中互惠、战略有效的讨价还价行为。

在本文中，我们研究当前的LLM智能体是否能在多属性双边谈判中战略性地利用关于对方偏好的信息。具体来说，我们将智能体置于一个受控的汽车购买讨价还价环境中，包含十个合同属性和随机生成的线性效用函数。每个智能体的效用是其对合同特征进行私有加权求和的结果，同时决定了其在各种结果上的偏好及其保留价值。由于这是一个熟悉的消费者谈判场景，它有助于减少领域理解的混淆因素，并让我们专注于战略推理。在不同条件下，我们改变买方、卖方、双方或任何一方是否收到关于对方偏好的提示级别排序摘要。然后我们在三个层面分析行为：最终结果、推理痕迹信念和回合层面讨价还价动态。我们的主要发现不仅仅是关于谈判对手偏好的信息对结果的影响有限，而是即使这些信息被正确建模，它也不能可靠地转化为战略讨价还价优势。虽然提供信息能够适度改善联合福利，但它并不会可靠地惠及信息持有者。特别是，向卖方提供买方偏好并不能帮助卖方获取价值，相反，卖方往往只是顺应买方。推理痕迹显示，这并非感知上的失败。知情智能体经常在早期就明确识别出谈判对手的优先事项。问题出在从建模到策略的转化环节。为了诊断这种转化，我们引入了衡量报价是否朝着智能体认为对方偏好的方向移动，以及这些移动是否伴随着智能体自身高价值属性上的收益的指标。我们的结果表明，智能体会对对方重视的方面做出回应，但不能可靠地将这些信息转化为互惠交换。由于智能体未能利用这种底层的效用结构来获取战略优势，它们的谈判受到对话中引入的第一个具体数值的强烈影响。与此模式一致，最终协议与首次提出的价格密切相关，而不是与实际效用权重相关。这表明模型过于依赖提示或对话中的具体数字，而没有利用应该指导高效讨价还价的潜在效用结构。

然后我们研究了是否可以通过强制智能体明确构建其交易来缩小这一差距。我们引入了一个"交易计划"干预，要求智能体在提出报价之前使用一个"给予/索取"模板。然而，这种强制结构同样不能提高效率。这表明缺失的不仅仅是阐述一次性交易的能力，而是在互惠的多轮讨价还价中嵌入这些交易的能力。这些结果指向一个更广泛的结论：当前的LLM智能体可以构建谈判相关信息，但不能可靠地利用它来跨回合战略性地组织讨价还价。即使智能体拥有关于谈判对手优先事项的准确信息，这些信息也不能持续转化为能够改善自身处境的互惠交换。

#### 我们将贡献总结如下：
- •获取谈判对手的偏好并不能可靠地转化为知情方的讨价还价优势：对结果的影响是适度的，并且往往反而使对方受益（第4节 (https://arxiv.org/html/2605.16575#S4)）。
- •这种失败不能用弱的对手建模来解释。知情智能体会形成关于对方优先事项的早期信念，这表明问题在于这些信念如何转化为讨价还价行为（第5节 (https://arxiv.org/html/2605.16575#S5)）。
- •回合层面分析显示，智能体会根据他们认为谈判对手看重的内容来行动，但不能可靠地将这些行动转化为自身优先事项上的收益（第6节 (https://arxiv.org/html/2605.16575#S6)）。
- •通过模板要求明确的给予/索取交易计划并不能使谈判更有效，这表明缺失的能力不是陈述交易的能力，而是将这些交易嵌入到互惠的多轮讨价还价中的能力（第7节 (https://arxiv.org/html/2605.16575#S7)）。

## 2. 相关工作

#### LLM作为谈判者。 几篇近期的论文表明，LLM能够在双边环境中进行非平凡的谈判。这一研究方向建立在早期的谈判对话工作上，如Lewis等人 (2017 (https://arxiv.org/html/2605.16575#bib.bib32))，该工作表明端到端的对话智能体可以学习用自然语言进行谈判，并且基于rollout的规划可以提高性能。Deng等人 (2024 (https://arxiv.org/html/2605.16575#bib.bib25)) 研究了在轻量提示下的买卖双方讨价还价，表明LLM可以实现高成交率，协商出接近理论指导基准的价格，并在标量价格讨价还价中利用信息不对称。Bianchi等人 (2024 (https://arxiv.org/html/2605.16575#bib.bib24)) 引入了 *negotiationarena*，一个涵盖最后通牒博弈、交易博弈和价格谈判的平台，并表明诸如攻击性等策略可以改变最终收益。Fu等人 (2023 (https://arxiv.org/html/2605.16575#bib.bib23)) 研究了在单物品买卖博弈中的自我对弈和AI反馈，表明一些模型可以在多轮中改善最终成交价格。Zhu等人 (2025 (https://arxiv.org/html/2605.16575#bib.bib28)) 分析了消费者市场中完全自动化的智能体间谈判，并识别出巨大的模型依赖性能差距以及多种失败模式，包括预算违规和不合理的交易。Liu等人 (2026 (https://arxiv.org/html/2605.16575#bib.bib27)) 进一步拓宽了范围，引入了一个涵盖双边到多对多市场的基准测试，并展示了在长时域谈判中的持续局限性。这些论文确立了LLM谈判既是可行的，也是行为丰富的。它们也补充了最近将谈判视为语言模型智能体有用试验场的工作 (Davidson等人，2024 (https://arxiv.org/html/2605.16575#bib.bib31))。

#### 博弈论评估与谈判工作流。 一个相关的研究方向是在博弈论环境中研究LLM。Hua等人 (2024 (https://arxiv.org/html/2605.16575#bib.bib26)) 评估了LLM在完全信息和不完全信息博弈中的理性，并提出结构化工作流来改善在诸如"要么接受要么放弃"等任务中的性能。相关地，Lorè和Heydari (2024 (https://arxiv.org/html/2605.16575#bib.bib41)) 研究了大型语言模型在经典的双人社会困境博弈中的战略行为，而Gandhi等人 (2023 (https://arxiv.org/html/2605.16575#bib.bib29)) 表明语言模型可以被提示在其他智能体、隐藏信息和竞争目标存在的博弈中执行战略推理。这些结果表明，LLM可以展示非平凡的战略行为，并且明确的博弈论框架可以改善理性和接近最优的分配。

#### 使用语言模型进行战略推理。 不限于谈判本身，越来越多的文献研究LLM是否能在涉及其他智能体、隐藏信息和竞争目标的场景中进行战略推理。Gandhi等人 (2023 (https://arxiv.org/html/2605.16575#bib.bib29)) 表明，预训练的语言模型可以被提示执行博弈中的战略推理，并在现实场景中展现类似人类的谈判策略。Liao等人 (2024 (https://arxiv.org/html/2605.16575#bib.bib30)) 进一步表明，自我对弈可以显著提高语言模型在谈判式非零和设定中的表现。

#### 自动谈判与讨价还价理论。 此外，我们的工作也属于更广泛的关于自动谈判、双边贸易以及不完全信息下讨价还价的学术文献 (Myerson和Satterthwaite，1983 (https://arxiv.org/html/2605.16575#bib.bib17)；Chatterjee和Samuelson，1983 (https://arxiv.org/html/2605.16575#bib.bib18)；Faratin等人，1998 (https://arxiv.org/html/2605.16575#bib.bib20)；He等人，2018 (https://arxiv.org/html/2605.16575#bib.bib21)；Baarslag等人，2013 (https://arxiv.org/html/2605.16575#bib.bib22))。经典模型为信息、效率和均衡提供了清晰的基准，但抽象掉了自然语言推理以及现代LLM交互中更丰富的议题结构。

虽然上述先前工作确立了LLM能够进行谈判、遵循工作流以及对博弈论场景建模，但这些研究主要评估最终结果，例如成交率、价格、整体理性或对效率的广泛度量。即使谈判在多轮中展开，研究对象通常是最终协议。最近的工作开始考察驱动这些结果的结构性机制，例如，Wang等人 (2026 (https://arxiv.org/html/2605.16575#bib.bib34)) 使用自动程序发现表明，前沿LLM在简单的序列博弈（如迭代石头剪刀布）中维护着高度复杂的对手模型。我们的论文采取了不同的方法，隔离了复杂的自然语言讨价还价中的一个特定过程级现象：那些能够推断对手偏好的智能体是否实际上会随时间将这些知识转化为互惠的、战略耦合的讨价还价行为。我们不是问一个工作流是否能改善最终收益，或者模型是否能利用简单的转移矩阵，而是分析信念痕迹、回合层面的报价变化，以及让步与自我收益之间的耦合。通过这样做，我们证明了在多属性语言中介的谈判中，建模伙伴的能力和执行多轮策略的能力仍然是两种不同且未对齐的能力。

## 3. 实验设计

我们在一个受控的多属性汽车购买领域研究双边谈判。设计的目的是隔离战略性信息使用：智能体面临相同的行动空间和讨价还价协议，而关于谈判对手偏好的信息通过实验进行操纵。

### 3.1. 多属性谈判环境

对手建模并非策略：LLM谈判者的局限

相似文章

智能体交易：当LLM智能体遇上金融市场

探究LLM风险决策中的结果层面相似性与机制层面一致性：来自圣彼得堡博弈的证据

多智能体协商中基于对手建模的偏好估计

LLM能否担任CEO？基于多角色智能体模拟的战略资源重新配置基准测试

LLM交易代理中的表示特征与风险反馈对齐

提交意见反馈