面向比较图的可靠LLM评估的提示扰动

arXiv cs.CL 2026/06/17 04:00 论文

摘要

提出了一种提示扰动框架，该框架生成扰动的提示变体，通过图级一致性检查过滤掉结构不一致的比较模式，然后应用标准排名方法产生更可靠的LLM排名。

arXiv:2606.17634v1 Announce Type: new Abstract: 评估大语言模型（LLM）对于理解其能力、比较竞争系统以及支持在实际中部署可靠模型至关重要。对于开放式任务，成对评估已成为一种流行范式，即比较同一提示的两个响应，并将获得的判断聚合成整体排名。该范式的核心挑战是非传递性：诱导的比较结果可能无法支持任何一致的全局排名。例如，可能观察到循环偏好，如$A \succ B \succ C \succ A$，或涉及平局的不一致，如$A \equiv B\equiv C\neq A$。这种矛盾使得最终排行榜不稳定且难以解释。在本文中，我们提出了一种提示扰动框架，用于提高成对LLM评估的一致性。我们的方法生成每个提示的扰动变体，利用由此产生的比较图来识别并过滤掉结构不一致的比较模式，然后将标准排名方法应用于过滤后的比较。该框架的一个关键特点是，在排名聚合之前，将图级结构一致性显式纳入评估流程。这提供了一种简单而有原则的方法，可以减少循环不一致性并提高LLM排名的可靠性。

查看原文

查看缓存全文

缓存时间: 2026/06/17 05:41

# 面向比较图的可靠LLM评估的提示扰动方法
来源：https://arxiv.org/abs/2606.17634
查看PDF (https://arxiv.org/pdf/2606.17634)

> **摘要：**评估大型语言模型（LLM）对于理解其能力、比较不同系统以及支持在实践中有序部署可靠模型至关重要。对于开放式任务，成对评估已成为一种流行范式：对同一提示的两个回答进行比较，并将由此产生的判断汇总为整体排名。该范式的核心挑战在于不可传递性：诱导出的比较结果可能无法支撑任何连贯的全局排名。例如，我们可能观察到诸如 \(A \succ B \succ C \succ A\) 的循环偏好，或涉及平局的不一致性，如 \(A \equiv B \equiv C \neq A\)。此类矛盾使得最终排行榜不稳定，难以解读。在本文中，我们提出了一种提示扰动框架，用于提高成对LLM评估的一致性。我们的方法为每个提示生成扰动变体，利用由此产生的比较图来识别并过滤掉结构不一致的比较模式，然后将标准排名方法应用于过滤后的比较结果。该框架的一个关键特性在于，图级别的结构一致性在排名聚合之前就被明确纳入评估流程。这提供了一种简单且有原则的方法，能够减少循环不一致性，提高LLM排名的可靠性。

## 提交历史

来自：董黄 [查看邮件](https://arxiv.org/show-email/404b2251/2606.17634)  
**[v1]** 2026年6月16日星期二 07:44:45 UTC (205 KB)

面向比较图的可靠LLM评估的提示扰动

相似文章

论大型语言模型评估中提示排名的稳定性

PromptAudit：审计基于LLM的漏洞检测中的提示敏感性

基于智能体评估与稳定性感知排序的多模态大语言模型鲁棒检查点选择

作为高效PRP重排序器的主动学习器

衡量开源权重 LLM 中的评估上下文发散：一种配对提示协议及对对齐管线特定异质性的初步证据

提交意见反馈