哪些变化重要?通过相关性敏感评估和求解器推理实现可信赖的法律AI
摘要
本文介绍了一套用于法律AI的相关性敏感评估套件,表明LLM对法律无关的扰动过于敏感,并提出LexGuard,一个基于形式推理的对抗性多代理框架,以提高法律推理的可靠性。
arXiv:2605.26530v1 Announce Type: new
摘要:法律推理需要区分哪些变化是重要的,哪些不是。法律AI应在法律无关的扰动下保持稳定,但当扰动改变法律实质性要点时应发生变化。我们将这一要求形式化为一个法律相关性敏感评估问题:LLM应仅对法律相关变化敏感。我们引入了一个统一的评估套件,涵盖司法公平性、鲁棒性和法规混淆场景中的应变化和不应变化评估。我们的评估表明,现有的法律LLM对法律无关的变化系统性地敏感,并且常常无法区分相关法律要素和法规规则。为了缓解这些失败,我们提出了LexGuard,一个基于形式推理的对抗性多代理框架。LexGuard将法规形式化为可执行约束,使用对抗性代理提取相互竞争的事实-法规论点,并调用SMT求解器验证法律满足性和逻辑一致性。实验表明,LexGuard通过减少对操纵性框架的脆弱性、改善相似法规的区分、限制法律无关属性的影响以及增加在良性改写下的一致性,提高了法律推理的可靠性。我们表明,法律可信赖性不仅需要准确性,还需要对法律实质性变化的校准敏感性。
查看缓存全文
缓存时间: 2026/05/27 09:05
# 哪些变化重要?通过相关性敏感评估和求解器支撑推理实现可信赖的法律AI 来源:https://arxiv.org/html/2605.26530 陈林泽¹,蔡宇凡¹,侯哲²,董劲松¹ ¹新加坡国立大学 ²格里菲斯大学 [email protected],[email protected],[email protected],[email protected] ###### 摘要 法律推理需要区分哪些变化是重要的,哪些不是。法律AI应在法律无关的扰动下保持稳定,但当扰动改变法律实质性要点时则应发生变化。我们将这一要求形式化为法律相关性敏感评估问题:大语言模型(LLMs)应仅对法律相关变化敏感。我们引入了一个统一的评估套件,涵盖司法公正性、鲁棒性和法条混淆场景中的“应改变”与“不应改变”评估。我们的评估表明,现有的法律LLM系统性地对法律无关的变化敏感,且经常无法区分相关的法律要素和法条规则。为缓解这些失败,我们提出了LexGuard,一个基于形式推理的对抗性多智能体框架。LexGuard将法条形式化为可执行约束,利用对抗性智能体提取竞争性的事实–法条论证,并调用SMT求解器验证法律满足性与逻辑一致性。实验表明,LexGuard通过降低对操纵性框架的脆弱性、改善相似法条间的消歧、限制法律无关属性的影响、以及增加良性重述下的一致性,提高了法律推理的可靠性。我们证明,法律可信赖不仅需要准确性,还需要对法律实质性变化具备校准后的敏感性。 ## 1 引言 大语言模型越来越多地用于法律任务,如法律问答、意见摘要、诉状起草和律师资格考试式推理(Katz et al., 2024;Hendrycks et al., 2021)。然而,法律推理是一个高风险场景,仅凭准确性是不够的。在法治体系中,司法裁决预期满足“形式理性”:结论应由明确、普遍且逻辑连贯的规则(Linna and Linna, 2025;Sadowski and Chudziak, 2025b)加以论证,并可追溯至适用的法规、解释和先例(Kesari et al., 2024)。当前基于LLM的法律系统,包括领域适配模型如ChatLaw(Cui et al., 2023)、LawLLM(Shu et al., 2024)和Lexi(Ho et al., 2025),仍易受虚构权威(Hou et al., 2024)、相似法条混淆(Savelka, 2023)以及无关属性敏感性的影响。法律推理的一个核心要求是决定“哪些变化重要”。对法定要素、主观状态、危害程度或适用例外的更改可能合理改变结果。相反,决策应保持对法律无关扰动的不变性,例如人口统计属性、程序背景、风格性改写、无关专家意见、对抗性框架或误导性的不适用法条引用(Yiran et al.)。区分法律相关与法律无关变化的能力是法治价值的基础:相似案件应同等对待,不同案件应基于法律理由加以区分,法律结论应可追溯至明确且连贯的法律规则。现有证据表明,当前LLM恰恰在这项区分上经常失败(Hu et al., 2025b)。最近的司法公正性评估显示,充当法官的LLM在人口统计、实质性和程序性因素上表现出普遍的不一致性、偏见和不平衡的不准确性。即使法律法规事实不变,LLM也可能被法律三段论推理中大前提、小前提和结论生成阶段的扰动所误导(Yiran et al.)。然而,现有评估通常孤立地研究这些现象。我们将公正且鲁棒的法律推理形式化为“法律相关性敏感评估”问题。我们不只评估LLM是否保持不变,而是询问LLM的推理在“应改变”扰动下是否改变,并在“不应改变”扰动下是否保持稳定。我们还统一了司法公正性、鲁棒性、对抗性框架和法条混淆评估。基于此观点,我们引入了一个新的评估套件,涵盖四类扰动:(1)对法律相关或无关属性的公平性扰动;(2)保持或改变法律含义的鲁棒性扰动;(3)试图操纵结论的对抗性框架扰动;(4)涉及相似法律规则和要素的法条混淆扰动。我们的评估表明,当前LLM在定义的扰动和攻击下往往不稳定。为缓解这些失败,我们提出了LexGuard,一个基于求解器支撑的对抗性多智能体法律推理框架。LexGuard首先将法条规定自动形式化为捕捉法律要素的可执行约束。然后利用检方和辩方对齐的对抗性智能体,从案件叙述中独立提取结构化的事实–法条论证元组。最后,SMT求解器检查竞争性论证是否满足形式化的法律约束,以及它们的结论是否逻辑一致。这种设计将相关性敏感的法律推理转化为一个可审计的过程:法律实质性变化应修改相应法律约束的可满足性,而无关变化则不应。我们在公开法律数据集(Li et al., 2023;Xue et al., 2024)以及我们的相关性敏感评估套件上评估了LexGuard。实验展示了四个方面的改进:标准法律推理性能,包括法条选择、判决预测和量刑质量;法律相关和无关扰动下的公平性;良性改写和对抗性框架攻击下的鲁棒性;以及对法条混淆错误的抵抗能力。除性能提升外,LexGuard还生成经求解器检查的符号化论证,使得法律结论能够对照明确的法律约束进行审计。我们的贡献总结如下: - 我们形式化了可信赖法律推理为“法律相关性敏感评估”问题,并以统一的“应改变”和“不应改变”扰动套件实例化,涵盖公平性、鲁棒性、对抗性攻击和法条混淆场景。 - 我们提出了LexGuard,一个基于求解器支撑的对抗性多智能体框架,将法条形式化为可执行约束,通过对抗性智能体提取竞争性法律论证,并利用SMT求解器判断判决。 - 我们实验表明,现有LLM法律推理器对法律要素变化敏感,且易受法条混淆和攻击影响,而LexGuard在判决准确性、法条选择、量刑质量、公平性、鲁棒性和可信赖性方面均有提升。 ## 2 法律相关性敏感评估 表1:提出的法律相关性敏感评估框架概览。每个评估轴对应一类针对法律推理特定组件的扰动。一个可信赖的法律模型应在无关变化下保持稳定,但当扰动改变法定要素、例外或法律后果时更新其决策。我们提出了一个“法律相关性敏感评估”框架,统一了反事实公平性评估和推理链鲁棒性评估。表1总结了评估设计。上半部分包含标签保持扰动,模型应保持不变;下半部分包含标签改变扰动,模型应更新其预测。 ### 2.1 评估原则 形式化地,设x为原始案例,f为法律推理模型,τ为扰动算子,生成修改后的案例τ(x)。模型输出:y = f(x), y′ = f(τ(x)). 核心问题不仅仅是y和y′是否相同,而是从y到y′的变化是否具有法律理由。我们将扰动分为两类。“标签保持扰动”仅改变法律无关信息,同时保持实质事实和适用法律不变。对于这些扰动,法律基础的模型应满足:f(x) = f(τ(x))。“标签改变扰动”修改至少一个法律实质性条件。对于这些扰动,模型应根据新的法律标签更新其预测:f(τ(x)) = y_τ,其中y_τ表示法律实质性修改后的新标签。对于标签保持扰动,我们衡量模型是否保持不变:Inv(f) = E_{(x,τ)}[I{f(x) = f(τ(x))}]。较低的invariance表明模型对法律无关变化敏感。对于标签改变扰动,我们衡量变化对齐度:Align(f) = E_{(x,τ)}[I{f(τ(x)) ≠ f(x)}]。更多细节见附录E.1。 ### 2.2 扰动分类 如表1总结,我们的分类涵盖法律外因素、表面事实表达、法律规则选择、事实提取、结论生成、法定要素、法律适用条件以及相关法条间的边界。 ##### 标签保持扰动。 这些扰动保持法律实质性事实和适用法律不变。 *司法公正性*针对法律外因素,如被告人口统计特征、受害者属性、辩护人属性、法院层级、审判公开性以及程序背景。 *良性鲁棒性*针对事实的表面形式,通过释义、同义词替换、描述顺序重排、风格性改写和无关叙述。 *大前提鲁棒性*针对适用法律规则,通过注入相似但不适用的法条、误导性引用、虚构权威、错误罪名或无关检索条款。 *小前提鲁棒性*针对事实提取,通过非决定性的事实编辑、法律等价要素描述、无关事实添加以及混淆但不实质的细节。 *结论级鲁棒性*针对最终决策生成,通过添加无关专家意见、先前无关行为、情感框架、角色劫持、强制判决指令或格式模仿的提示注入。 ##### 标签改变扰动。 这些扰动改变法律实质性条件,因此要求模型更新其预测。 *法定要素敏感性*改变构成要素,如行为、对象、主体身份、犯罪角色、数额门槛、危害程度或因果关系。 *主观状态敏感性*修改主观可责性,如故意、过失、明知、目的或对违法性的认识。 *例外与条件敏感性*改变法律适用条件,包括正当防卫、未遂、共犯、自首、累犯、减轻或加重情节。 *法条混淆敏感性*测试具有重叠表面事实但不同适用条件的相关法条之间的边界。 ### 2.3 评估协议 对于每个原始案例,我们构建配对扰动案例。每个扰动带有两种元数据标注:(i)是标签保持还是标签改变,(ii)针对哪个推理组件。对于标签保持扰动,金标准标签保持不变。对于标签改变扰动,金标准标签应反映法律修改后的结果。然后,我们在原始案例和扰动案例上评估每个模型。输出在多个层次上进行比较,包括最终判决、适用法条集、一般条款选择、具体条款选择以及(若可用)量刑结果。该协议使我们能够诊断四种不同的失败模式:在法律外反事实下的不公平性、良性改写下的不稳定性、对抗性法律框架的易感性,以及无法区分法律实质性变化与无关变化。 ## 3 基于求解器支撑的推理 请参阅图1 图1:LexGuard概览。(顶部)*法律形式化*:将法条和司法解释翻译为SMT可检查的法律约束。(左侧)*对抗性智能体*:检方和辩方智能体独立从同一案件叙述中提取事实和候选法条。(底部)*基于求解器支撑的法律推理*:将提取的事实和候选法条编码为统一约束集。SMT求解器检查法条适用性,检测不一致性,法官返回基于形式的判决。 如图1所示,LexGuard将基于LLM的法律解释与形式推理相结合。给定案例x,系统输出判决y = ⟨法条, 条款, 刑罚, 解释⟩,其中解释包含经检查的法律条件和支持的案例事实。关键思想是将“法律提议”与“法律检查”分离:LLM智能体识别潜在相关的事实和法条,而SMT求解器决定这些法条在形式法律知识库下是否真正可适用。详细形式化见附录B。 ### 3.1 法律形式化 我们首先借助LLM从法条和司法解释中构建形式法律知识库K。每条法律规则表示为条件约束。条件指定法条或条款何时适用,法律效果指定结果罪名、责任或刑罚范围。具体地,每条法条有一个条文级守卫,每个条款有一个条款级守卫。条文守卫检查案例是否属于法条的一般范围。条款守卫检查细粒度的法律要求,如行为主体、行为、故意、危害、因果关系、受保护法益、加重因素、减轻因素或法定例外。简化规则为: ArticleGuard_i ∧ ClauseGuard_{i,j} ⇒ Penalty_{i,j}。 形式知识库是自动生成的。
相似文章
是时候 REFLECT 了:我们能信任 LLM 评判者来评估基于证据的研究代理吗?
本文介绍了 REFLECT,这是一个用于评估 LLM 评判者在深度研究代理评估中可靠性的元评估基准。实验表明,当前的 LLM 评判者仍然不可靠,在推理、工具使用和报告质量失败方面的整体准确率低于 55%。
推理者还是翻译者?税法中的污染感知评估与神经符号鲁棒性
本文实证研究了LLMs在税法中的法律推理,表明数据污染会夸大性能,而神经符号混合系统比单体LLMs提供更可靠和稳健的泛化能力。
连接法律解释与形式逻辑:忠实性、假设与人工智能法律推理的未来
本文指出了人工智能法律推理中法律解释与形式逻辑之间的系统性鸿沟,提出了一种神经符号方法来弥合这一鸿沟,并展示了在严格形式蕴含条件下重新标注法律自然语言推理数据时出现的显著标签偏移。
为什么大多数法律 AI 演示在生产环境中失败
本文详细阐述了法律 AI 系统在生产环境中面临的三种常见故障模式:将所有来源视为同等可信、无法处理相互矛盾的法律观点,以及缺乏特定律所的内部知识。文章提出了诸如权威性加权、分歧检测以及注释层等解决方案,以建立系统的可信度与实用性。
作为脆弱性的相关性:Web检索如何削弱LLM智能体的安全对齐
本文研究了将Web检索集成到LLM智能体中如何削弱安全对齐,揭示了“安全来源悖论”:即使是面向安全的文档也会增加有害遵从性。本文介绍了AgentREVEAL诊断框架和HarmURLBench基准,用于分析和评估检索引发的安全漏洞。