人类谈判的自动化调解器:通过结构化LLM流水线进行前期调解
摘要
本文介绍了一种用于人类谈判的自动化调解器,它使用结构化LLM模块流水线进行前期调解。在人类受试者实验中,该系统在偏好推断方面降低了误差,同时实现了与专业人类调解员相当的准备效果。
arXiv:2606.11379v1 公告类型:新
摘要:前期调解是人直接谈判之前的准备阶段,在达成互利协议中起着关键作用,但由于成本、时间和缺乏训练有素的调解员,常常被省略。我们引入了一种用于人类谈判的自动化调解器,该调解器作为结构化LLM模块流水线实现,支持整合性谈判环境中的前期调解。该流水线将准备工作分解为对话、偏好预测、回复级别批评和结构化总结等专门模块,分离推理、生成和评估,以解决单一提示方法的局限性。我们按照常见的LLM系统术语将每个模块称为"agent",但这些组件并非自主运行,也不进行点对点交互;输出按固定顺序向前传递。我们在两个受控的人类受试者实验中评估了该系统,在多议题谈判场景中将基于AI的前期调解与专业人类调解员进行了比较。在短期自我报告指标上,自动化调解器在准备效果方面与人类调解员大致相当,包括对调解员的信任和达成互利协议的信心,同时在我们的场景和提示下,在偏好推断任务上实现了显著更低的误差(RMSE降低36%)。第二项研究表明,有针对性的提示优化将过度肯定模式从36.6%降至16.8%,与人类调解员基线一致。我们的研究结果表明,结构化LLM流水线可以提供可扩展、低努力的前期调解支持,在短期自我报告准备效果上与人类调解员大致相当。该流水线的单方设计反映了当前人类调解员进行前期调解的方式,并支持在争议各方之间并行部署,从而实现可扩展性。
查看缓存全文
缓存时间: 2026/06/11 13:47
# 人类谈判的自动化调解人:通过结构化LLM流水线进行预调解 来源:https://arxiv.org/html/2606.11379 ###### 摘要 预调解是直接人类谈判前的准备阶段,在达成互惠协议中起着关键作用,但由于成本、时间限制以及缺乏训练有素的调解人,这一阶段往往被省略。我们提出了一种用于人类谈判的自动化调解人,实现为结构化LLM模块流水线,支持整合式谈判环境中的预调解。该流水线将准备工作分解为专门化的LLM模块,用于对话、偏好预测、回复级批评和结构化总结,将推理、生成和评估分离,以解决单一提示方法的局限性。尽管我们使用术语“智能体”来指代每个模块(遵循LLM系统常用术语),但这些组件并不具备自主性,也不进行对等交互;输出按固定顺序向前传递。我们在两项受控人类受试者实验中评估了该系统,将基于AI的预调解与专业人类调解人在多议题谈判场景中进行比较。结果显示,在短期自我报告指标上,自动化调解人取得的准备成果与人类调解人大致相当——包括对调解人的信任以及达成互惠协议的信心——同时在我们场景和提示下的偏好推断任务中实现了显著更低的误差(RMSE降低36%)。第二项研究表明,有针对性的提示改进成功地将过度肯定模式从36.6%降至16.8%,达到人类调解人基线水平。总体而言,我们的发现表明,结构化LLM流水线可以提供可扩展、低投入的预调解支持,在短期自我报告的准备成果上与人类调解人大致相当。该流水线的单方设计是一个刻意的架构特征:它反映了当前人类调解人进行预调解的方式,并能够并行部署到争议各方,支持了我们此项工作所追求的扩展性。 人类谈判的自动化调解人:通过结构化LLM流水线进行预调解 Jamie Bergen, Sarit Kraus ## 1 引言 数字时代已将决策转向大规模、异步的谈判,带来了冲突与不稳定的新挑战。调解在这些背景下日益必要,但需求远超人类调解人的能力,使得AI支持既关键又具有变革性。我们专注于整合式谈判,即各方通过识别潜在利益并在议题间进行权衡来寻求互惠结果。预调解,即冲突人类各方会面前的准备阶段,被广泛认为是成功解决冲突的关键Moore (2014 (https://arxiv.org/html/2606.11379#bib.bib18)); Lande (2022 (https://arxiv.org/html/2606.11379#bib.bib12))。在此阶段,个体澄清自身利益,审视假设,并为富有成效的对话做好准备。它帮助调解人初步了解争议、谈判者的偏好及其对谈判过程的态度Wissler and Hinshaw (2022 (https://arxiv.org/html/2606.11379#bib.bib34))。这可以增加谈判者对调解人及谈判过程的信任。实证研究表明,充分的准备能显著改善谈判结果:参与结构化准备的各方能获得更高的联合收益,并对协议表示更满意Thompson (2010 (https://arxiv.org/html/2606.11379#bib.bib29)); Olekalns and Adair (2014 (https://arxiv.org/html/2606.11379#bib.bib20))。然而,由于时间限制、成本以及缺乏训练有素的调解人,预调解常常被简化或完全跳过。Wissler and Hinshaw (2022 (https://arxiv.org/html/2606.11379#bib.bib34)) 调查了超过1000名调解人,发现34%的人会在民事案件中跳过实质性的会前沟通,家庭案件中这一比例升至61%。这一差距为AI驱动的支持提供了机会。自动化调解智能体可以同时私下与所有谈判者互动,毫无延迟地以低成本为他们准备谈判。它可以更深入地理解人类谈判者,并生成调解人可在谈判过程中使用的报告。大型语言模型的最新进展已在辅导Passmore et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib21))和心理健康支持Fitzpatrick et al. (2017 (https://arxiv.org/html/2606.11379#bib.bib6))方面显示出潜力,表明对话式AI可以帮助扩大预调解服务的可及性。先前关于自动化谈判智能体的研究表明,使用此类系统进行训练可以改善人们在谈判任务中的行为Lin et al. (2014 (https://arxiv.org/html/2606.11379#bib.bib15))。虽然LLM已被探索用于在联合会议中协助人类调解人,但预调解阶段本身仍然是基于LLM系统的一个基本上未触及的应用领域,尽管它是实践中经常被跳过的阶段,也是可扩展的AI支持最直接扩大可及性的地方。因此,针对预调解而非联合会议是这项工作的核心贡献:它将LLM支持转向调解工作流程中可及性差距最大的部分,并且自动化可以补充而非替代人类调解人。然而,预调解的复杂性——需要心理理解、同理心、策略指导和伦理考量——超出了单一提示LLM方法通常提供的能力。 ##### 本研究。 我们开发了一个用于预调解的结构化LLM流水线。该流水线包含专门的模块,用于用户预测、对话、批评和总结生成。这种关注点分离允许每个模块针对其特定功能进行优化,同时系统保持连贯、适当的交互。尽管我们使用术语“智能体”来指代每个模块的功能角色——遵循LLM文献中的常见用法——但组件并不表现出自主性或对等协调;输出按预定义顺序向前传递。我们在两项研究中评估了我们的系统,将AI调解人与人类调解人在室友冲突准备场景中进行比较。 ##### 贡献。 (1) 一个专门针对预调解阶段的结构化LLM流水线,包含用于预测、对话、批评和总结的专门模块,通过生成的报告支持人在环监督。(2) 来自两项受控人类受试者研究的经验证据表明,该流水线产生的短期自我报告准备成果与专业人类调解人大致相当,并且在我们的场景中偏好推断任务的误差更低。(3) 针对将基于LLM的系统分解用于人际应用的设计建议,并明确关注奉承行为和监督问题。 ## 2 相关工作 ### 2.1 预调解与冲突准备 预调解在冲突解决中发挥着基本作用:帮助各方识别潜在利益、管理情绪并建立现实期望Moore (2014 (https://arxiv.org/html/2606.11379#bib.bib18))。它还提供了良好机会,让调解人了解各方偏好并与之建立融洽关系Moore (2014 (https://arxiv.org/html/2606.11379#bib.bib18))。基于利益的原则性谈判模型Fisher et al. (1991 (https://arxiv.org/html/2606.11379#bib.bib5))强调将立场与利益分离,这是一种准备促进的认知转变。Bush和Folger的Bush and Folger (2005 (https://arxiv.org/html/2606.11379#bib.bib2))转化式调解理论强调准备如何培养赋权(恢复各方的自主感)和认可(认可对方观点)。尽管其价值有文献记载,但预调解常因资源限制而被削减,这为可扩展的AI解决方案创造了机会。 ### 2.2 基于LLM的谈判与调解支持 LLM最近已被应用于协助人类调解人进行双边谈判,方式包括:(1) 改写敌意信息,(2) 建议干预策略,(3) 应要求提出解决方案Westermann et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib33)); Tan et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib26))。然而,人类仍处于控制地位。Hua et al. Hua et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib10)) 引入了基于LLM的商业谈判智能体,通过基于“价值影响”的上下文学习来重写违反规范的话语。Zhou et al. Zhou et al. (2019 (https://arxiv.org/html/2606.11379#bib.bib38)) 开发了一个谈判教练,实时推荐卖方策略,基于人类对话训练;它将利润提高了近60%,突显了上下文感知策略建模的潜力。然而,目前尚无针对预调解阶段进行人类受试者实验的AI干预研究。相关的共识建立工作与调解有相似之处。Habermas机器Tessler et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib28)) 使用LLM在讨论社会或政治议题的个体之间寻找共同点,生成候选群体陈述并使用基于预测偏好的个性化奖励模型进行排名。Triantafyllopoulos和Kalles (2025 (https://arxiv.org/html/2606.11379#bib.bib31)) 提出了一个实证评估,研究LLM驱动的实时共识建立讨论中的促进效果,发现ChatGPT 4.0在将参与者意见与生成提案对齐方面最为有效。相比之下,我们开发了一个自动化整合式谈判预调解人,旨在揭示潜在利益并促进互惠权衡。我们旨在将责任从人类调解人转移到自动化系统,同时确保结果保持透明,可在后续谈判中用于人类监督。 ### 2.3 复杂任务的分解式LLM架构 分解式LLM架构——包括更广泛类别的基于LLM的多智能体系统(LLM-MAS)——已被证明能改善各领域的问题解决能力Guo et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib7)); Tran et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib30)),并在常识推理Rasal (2024 (https://arxiv.org/html/2606.11379#bib.bib23)); Zhang et al. (2025a (https://arxiv.org/html/2606.11379#bib.bib36),b (https://arxiv.org/html/2606.11379#bib.bib37))、越狱防御Zeng et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib35))、城市规划Zhu et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib39))、个人助手Li et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib13)); Sun et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib25))、教育Mushtaq et al. (2025 (https://arxiv.org/html/2606.11379#bib.bib19))和软件开发Hong et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib9)); Dong et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib4)); Qian et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib22)); Tao et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib27))中表现出优于单一LLM的性能。尽管取得了进展,但关键挑战仍然存在Guo et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib7)); Han et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib8)),包括任务分解、角色定义、智能体协调、可扩展性以及维护一致上下文。复杂的人际任务受益于专门的智能体架构。研究表明,专门的批评智能体在输出质量上显著优于自我批评方法。Self-Refine Madaan et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib16)) 显示迭代反馈能改善跨领域性能。CriticGPT McAleese et al. (2024 (https://arxiv.org/html/2606.11379#bib.bib17)) 发现,训练有素的LLM批评者优于人类评审者,模型批评在63%的比较中被偏好。关键是,将批评者与生成者分离可以避免“思维退化”现象,即自我批评模型强化有缺陷的推理Liang et al. (2023 (https://arxiv.org/html/2606.11379#bib.bib14))。宪法AI Bai et al. (2022 (https://arxiv.org/html/2606.11379#bib.bib1)) 证明了明确原则可以指导AI自我监督,我们通过批评模块扩展了这一方法。我们借鉴了关于分解式LLM系统的文献;然而,如第3节 (https://arxiv.org/html/2606.11379#S3) 所述,我们自己的系统实现为四个专门LLM模块的序列流水线,而非具有对等协调的自主多智能体系统。 ## 3 系统架构 我们的系统实现为四个专门LLM模块加一个可选语音界面的序列流水线(图1 (https://arxiv.org/html/2606.11379#S3.F1))。每个模块使用GPT-4o作为底层模型。我们使用术语“智能体”来表示每个模块的独特功能角色——遵循LLM系统文献中的常见用法——但组件不表现出自主性、对等通信或分散决策,输出按预定义顺序向前传递。因此,该系统最好被描述为序列流水线,而非经典意义上的自主多智能体系统。 参考图注图 1:预调解的流水线架构。预调解对话模块协调用户交互,而专门模块处理预测、监督和文档记录,输出按预定义顺序向前传递。模块被称为“智能体”以表示不同的LLM角色;该系统作为一个序列流水线运行,而非自主多智能体系统。可选的语音转文本模块支持语音交互。##### 用户预测智能体。 根据从SVI框架Curhan et al. (2006 (https://arxiv.org/html/2606.11379#bib.bib3)) 推导出的11个参数单独分析用户输入,包括偏好优先级、情绪状态以及合作与竞争取向。这些维度专门为预调解选择,因为主观价值清单是一个经过验证的、广泛使用的工具,用于捕捉谈判体验的主观维度,为预测模块提供了原则性的、基于经验的目标,而非临时的特征集。智能体接收对话历史,并为每个参数输出带有置信度分数的结构化JSON预测。这些预测为预调解对话智能体的对话策略提供信息,从而实现个性化指导。 ##### 预调解对话智能体。 主要对话界面,基于对话历史和用户预测智能体的分析生成上下文相关回复。智能体遵循一个结构化的八阶段协议:(1) 建立融洽关系、(2) 深入探索各议题偏好、(3) 优先排序与权衡、(4) 换位思考、(5) 情绪意识、(6) 信心、(7) 人际关系,以
相似文章
Show HN:Mediator.ai —— 运用纳什谈判博弈与 LLM 使公平协商流程化
Mediator.ai 是一款将纳什谈判博弈论与 LLM 相结合的工具,旨在促进公平的协作式谈判。它会基于双方明确的需求生成并评估候选协议,直至找到最优解。
SoCRATES: 迈向跨领域与社会认知变化的主动式LLM调解的可靠自动评估
SoCRATES提出了一个真实的多领域基准,用于评估主动式LLM调解器,显示顶尖模型在冲突解决中仅能弥合约三分之一的共识差距。
AutoLLMResearch:通过从低成本学习来优化高成本,训练研究智能体以自动化大型语言模型实验配置
本文介绍了 AutoLLMResearch,这是一个智能体框架,旨在通过在低保真环境中学习并外推至高成本设置,实现昂贵的大型语言模型(LLM)实验配置的自动化。其目标是减少可扩展 LLM 研究中的计算浪费以及对专家直觉的依赖。
多智能体协商中基于对手建模的偏好估计
本文提出了一种新颖的偏好估计方法,将大型语言模型(LLM)的自然语言信息集成到结构化贝叶斯对手建模框架中,用于多智能体协商。该方法利用LLM从话语中提取定性线索,并将其转换为概率格式,在多方协商基准上展示了改进的协议达成率和偏好估计准确性。
教育中的LLM评判:基于课程大纲的评分流水线
本文提出了一种基于课程大纲的LLM评判流水线,用于高风险考试备考中的自动化试题评分。该流水线利用教学大纲材料及评分指南,提升一致性与透明度。初步评估显示,其评分结果与人工导师相当。