人类谈判的自动化调解器：通过结构化LLM流水线进行前期调解

arXiv cs.AI 2026/06/11 04:00 论文

llm negotiation mediation structured-pipeline human-subject-experiment preference-prediction

摘要

本文介绍了一种用于人类谈判的自动化调解器，它使用结构化LLM模块流水线进行前期调解。在人类受试者实验中，该系统在偏好推断方面降低了误差，同时实现了与专业人类调解员相当的准备效果。

arXiv:2606.11379v1 公告类型：新摘要：前期调解是人直接谈判之前的准备阶段，在达成互利协议中起着关键作用，但由于成本、时间和缺乏训练有素的调解员，常常被省略。我们引入了一种用于人类谈判的自动化调解器，该调解器作为结构化LLM模块流水线实现，支持整合性谈判环境中的前期调解。该流水线将准备工作分解为对话、偏好预测、回复级别批评和结构化总结等专门模块，分离推理、生成和评估，以解决单一提示方法的局限性。我们按照常见的LLM系统术语将每个模块称为"agent"，但这些组件并非自主运行，也不进行点对点交互；输出按固定顺序向前传递。我们在两个受控的人类受试者实验中评估了该系统，在多议题谈判场景中将基于AI的前期调解与专业人类调解员进行了比较。在短期自我报告指标上，自动化调解器在准备效果方面与人类调解员大致相当，包括对调解员的信任和达成互利协议的信心，同时在我们的场景和提示下，在偏好推断任务上实现了显著更低的误差（RMSE降低36%）。第二项研究表明，有针对性的提示优化将过度肯定模式从36.6%降至16.8%，与人类调解员基线一致。我们的研究结果表明，结构化LLM流水线可以提供可扩展、低努力的前期调解支持，在短期自我报告准备效果上与人类调解员大致相当。该流水线的单方设计反映了当前人类调解员进行前期调解的方式，并支持在争议各方之间并行部署，从而实现可扩展性。

查看原文

查看缓存全文

缓存时间: 2026/06/11 13:47

# 人类谈判的自动化调解人：通过结构化LLM流水线进行预调解
来源：https://arxiv.org/html/2606.11379

###### 摘要

预调解是直接人类谈判前的准备阶段，在达成互惠协议中起着关键作用，但由于成本、时间限制以及缺乏训练有素的调解人，这一阶段往往被省略。我们提出了一种用于人类谈判的自动化调解人，实现为结构化LLM模块流水线，支持整合式谈判环境中的预调解。该流水线将准备工作分解为专门化的LLM模块，用于对话、偏好预测、回复级批评和结构化总结，将推理、生成和评估分离，以解决单一提示方法的局限性。尽管我们使用术语“智能体”来指代每个模块（遵循LLM系统常用术语），但这些组件并不具备自主性，也不进行对等交互；输出按固定顺序向前传递。我们在两项受控人类受试者实验中评估了该系统，将基于AI的预调解与专业人类调解人在多议题谈判场景中进行比较。结果显示，在短期自我报告指标上，自动化调解人取得的准备成果与人类调解人大致相当——包括对调解人的信任以及达成互惠协议的信心——同时在我们场景和提示下的偏好推断任务中实现了显著更低的误差（RMSE降低36%）。第二项研究表明，有针对性的提示改进成功地将过度肯定模式从36.6%降至16.8%，达到人类调解人基线水平。总体而言，我们的发现表明，结构化LLM流水线可以提供可扩展、低投入的预调解支持，在短期自我报告的准备成果上与人类调解人大致相当。该流水线的单方设计是一个刻意的架构特征：它反映了当前人类调解人进行预调解的方式，并能够并行部署到争议各方，支持了我们此项工作所追求的扩展性。

人类谈判的自动化调解人：通过结构化LLM流水线进行预调解

Jamie Bergen, Sarit Kraus

## 1 引言

数字时代已将决策转向大规模、异步的谈判，带来了冲突与不稳定的新挑战。调解在这些背景下日益必要，但需求远超人类调解人的能力，使得AI支持既关键又具有变革性。我们专注于整合式谈判，即各方通过识别潜在利益并在议题间进行权衡来寻求互惠结果。预调解，即冲突人类各方会面前的准备阶段，被广泛认为是成功解决冲突的关键Moore (2014 (https://arxiv.org/html/2606.11379#bib.bib18)); Lande (2022 (https://arxiv.org/html/2606.11379#bib.bib12))。在此阶段，个体澄清自身利益，审视假设，并为富有成效的对话做好准备。它帮助调解人初步了解争议、谈判者的偏好及其对谈判过程的态度Wissler and Hinshaw (2022 (https://arxiv.org/html/2606.11379#bib.bib34))。这可以增加谈判者对调解人及谈判过程的信任。实证研究表明，充分的准备能显著改善谈判结果：参与结构化准备的各方能获得更高的联合收益，并对协议表示更满意Thompson (2010 (https://arxiv.org/html/2606.11379#bib.bib29)); Olekalns and Adair (2014 (https://arxiv.org/html/2606.11379#bib.bib20))。然而，由于时间限制、成本以及缺乏训练有素的调解人，预调解常常被简化或完全跳过。Wissler and Hinshaw (2022 (https://arxiv.org/html/2606.11379#bib.bib34)) 调查了超过1000名调解人，发现34%的人会在民事案件中跳过实质性的会前沟通，家庭案件中这一比例升至61%。这一差距为AI驱动的支持提供了机会。自动化调解智能体可以同时私下与所有谈判者互动，毫无延迟地以低成本为他们准备谈判。它可以更深入地理解人类谈判者，并生成调解人可在谈判过程中使用的报告。大型语言模型的最新进展已在辅导Passmore et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib21))和心理健康支持Fitzpatrick et al. (2017 (https://arxiv.org/html/2606.11379#bib.bib6))方面显示出潜力，表明对话式AI可以帮助扩大预调解服务的可及性。先前关于自动化谈判智能体的研究表明，使用此类系统进行训练可以改善人们在谈判任务中的行为Lin et al. (2014 (https://arxiv.org/html/2606.11379#bib.bib15))。虽然LLM已被探索用于在联合会议中协助人类调解人，但预调解阶段本身仍然是基于LLM系统的一个基本上未触及的应用领域，尽管它是实践中经常被跳过的阶段，也是可扩展的AI支持最直接扩大可及性的地方。因此，针对预调解而非联合会议是这项工作的核心贡献：它将LLM支持转向调解工作流程中可及性差距最大的部分，并且自动化可以补充而非替代人类调解人。然而，预调解的复杂性——需要心理理解、同理心、策略指导和伦理考量——超出了单一提示LLM方法通常提供的能力。

##### 本研究。

我们开发了一个用于预调解的结构化LLM流水线。该流水线包含专门的模块，用于用户预测、对话、批评和总结生成。这种关注点分离允许每个模块针对其特定功能进行优化，同时系统保持连贯、适当的交互。尽管我们使用术语“智能体”来指代每个模块的功能角色——遵循LLM文献中的常见用法——但组件并不表现出自主性或对等协调；输出按预定义顺序向前传递。我们在两项研究中评估了我们的系统，将AI调解人与人类调解人在室友冲突准备场景中进行比较。

##### 贡献。

(1) 一个专门针对预调解阶段的结构化LLM流水线，包含用于预测、对话、批评和总结的专门模块，通过生成的报告支持人在环监督。(2) 来自两项受控人类受试者研究的经验证据表明，该流水线产生的短期自我报告准备成果与专业人类调解人大致相当，并且在我们的场景中偏好推断任务的误差更低。(3) 针对将基于LLM的系统分解用于人际应用的设计建议，并明确关注奉承行为和监督问题。

## 2 相关工作

### 2.1 预调解与冲突准备

预调解在冲突解决中发挥着基本作用：帮助各方识别潜在利益、管理情绪并建立现实期望Moore (2014 (https://arxiv.org/html/2606.11379#bib.bib18))。它还提供了良好机会，让调解人了解各方偏好并与之建立融洽关系Moore (2014 (https://arxiv.org/html/2606.11379#bib.bib18))。基于利益的原则性谈判模型Fisher et al. (1991 (https://arxiv.org/html/2606.11379#bib.bib5))强调将立场与利益分离，这是一种准备促进的认知转变。Bush和Folger的Bush and Folger (2005 (https://arxiv.org/html/2606.11379#bib.bib2))转化式调解理论强调准备如何培养赋权（恢复各方的自主感）和认可（认可对方观点）。尽管其价值有文献记载，但预调解常因资源限制而被削减，这为可扩展的AI解决方案创造了机会。

### 2.2 基于LLM的谈判与调解支持

LLM最近已被应用于协助人类调解人进行双边谈判，方式包括：(1) 改写敌意信息，(2) 建议干预策略，(3) 应要求提出解决方案Westermann et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib33)); Tan et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib26))。然而，人类仍处于控制地位。Hua et al. Hua et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib10)) 引入了基于LLM的商业谈判智能体，通过基于“价值影响”的上下文学习来重写违反规范的话语。Zhou et al. Zhou et al. (2019 (https://arxiv.org/html/2606.11379#bib.bib38)) 开发了一个谈判教练，实时推荐卖方策略，基于人类对话训练；它将利润提高了近60%，突显了上下文感知策略建模的潜力。然而，目前尚无针对预调解阶段进行人类受试者实验的AI干预研究。相关的共识建立工作与调解有相似之处。Habermas机器Tessler et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib28)) 使用LLM在讨论社会或政治议题的个体之间寻找共同点，生成候选群体陈述并使用基于预测偏好的个性化奖励模型进行排名。Triantafyllopoulos和Kalles (2025 (https://arxiv.org/html/2606.11379#bib.bib31)) 提出了一个实证评估，研究LLM驱动的实时共识建立讨论中的促进效果，发现ChatGPT 4.0在将参与者意见与生成提案对齐方面最为有效。相比之下，我们开发了一个自动化整合式谈判预调解人，旨在揭示潜在利益并促进互惠权衡。我们旨在将责任从人类调解人转移到自动化系统，同时确保结果保持透明，可在后续谈判中用于人类监督。

### 2.3 复杂任务的分解式LLM架构

分解式LLM架构——包括更广泛类别的基于LLM的多智能体系统（LLM-MAS）——已被证明能改善各领域的问题解决能力Guo et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib7)); Tran et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib30))，并在常识推理Rasal (2024 (https://arxiv.org/html/2606.11379#bib.bib23)); Zhang et al. (2025a (https://arxiv.org/html/2606.11379#bib.bib36),b (https://arxiv.org/html/2606.11379#bib.bib37))、越狱防御Zeng et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib35))、城市规划Zhu et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib39))、个人助手Li et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib13)); Sun et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib25))、教育Mushtaq et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib19))和软件开发Hong et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib9)); Dong et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib4)); Qian et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib22)); Tao et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib27))中表现出优于单一LLM的性能。尽管取得了进展，但关键挑战仍然存在Guo et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib7)); Han et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib8))，包括任务分解、角色定义、智能体协调、可扩展性以及维护一致上下文。复杂的人际任务受益于专门的智能体架构。研究表明，专门的批评智能体在输出质量上显著优于自我批评方法。Self-Refine Madaan et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib16)) 显示迭代反馈能改善跨领域性能。CriticGPT McAleese et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib17)) 发现，训练有素的LLM批评者优于人类评审者，模型批评在63%的比较中被偏好。关键是，将批评者与生成者分离可以避免“思维退化”现象，即自我批评模型强化有缺陷的推理Liang et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib14))。宪法AI Bai et al. (2022 (https://arxiv.org/html/2606.11379#bib.bib1)) 证明了明确原则可以指导AI自我监督，我们通过批评模块扩展了这一方法。我们借鉴了关于分解式LLM系统的文献；然而，如第3节 (https://arxiv.org/html/2606.11379#S3) 所述，我们自己的系统实现为四个专门LLM模块的序列流水线，而非具有对等协调的自主多智能体系统。

## 3 系统架构

我们的系统实现为四个专门LLM模块加一个可选语音界面的序列流水线（图1 (https://arxiv.org/html/2606.11379#S3.F1)）。每个模块使用GPT-4o作为底层模型。我们使用术语“智能体”来表示每个模块的独特功能角色——遵循LLM系统文献中的常见用法——但组件不表现出自主性、对等通信或分散决策，输出按预定义顺序向前传递。因此，该系统最好被描述为序列流水线，而非经典意义上的自主多智能体系统。

参考图注图 1：预调解的流水线架构。预调解对话模块协调用户交互，而专门模块处理预测、监督和文档记录，输出按预定义顺序向前传递。模块被称为“智能体”以表示不同的LLM角色；该系统作为一个序列流水线运行，而非自主多智能体系统。可选的语音转文本模块支持语音交互。##### 用户预测智能体。

根据从SVI框架Curhan et al. (2006 (https://arxiv.org/html/2606.11379#bib.bib3)) 推导出的11个参数单独分析用户输入，包括偏好优先级、情绪状态以及合作与竞争取向。这些维度专门为预调解选择，因为主观价值清单是一个经过验证的、广泛使用的工具，用于捕捉谈判体验的主观维度，为预测模块提供了原则性的、基于经验的目标，而非临时的特征集。智能体接收对话历史，并为每个参数输出带有置信度分数的结构化JSON预测。这些预测为预调解对话智能体的对话策略提供信息，从而实现个性化指导。

##### 预调解对话智能体。

主要对话界面，基于对话历史和用户预测智能体的分析生成上下文相关回复。智能体遵循一个结构化的八阶段协议：(1) 建立融洽关系、(2) 深入探索各议题偏好、(3) 优先排序与权衡、(4) 换位思考、(5) 情绪意识、(6) 信心、(7) 人际关系，以

人类谈判的自动化调解器：通过结构化LLM流水线进行前期调解

相似文章

Show HN：Mediator.ai —— 运用纳什谈判博弈与 LLM 使公平协商流程化

SoCRATES: 迈向跨领域与社会认知变化的主动式LLM调解的可靠自动评估

AutoLLMResearch：通过从低成本学习来优化高成本，训练研究智能体以自动化大型语言模型实验配置

多智能体协商中基于对手建模的偏好估计

教育中的LLM评判：基于课程大纲的评分流水线

提交意见反馈