闭环:形式化验证的法律作为自我改进法律AI的奖励信号
摘要
本文提出了一种架构,该架构使用形式化验证的法律作为训练法律AI的奖励信号,自适应地将法律规则自动形式化为形式化演算,并采用验证器确保可证明的正确性,在德国和美国法律示例上进行了演示。
arXiv:2606.23913v1 公告类型:新
摘要:本文开发了一种架构,该架构创建了一个可形式化验证的奖励信号来训练法律AI,将数学AI中“LLM提出,验证器处置”的范式适配到法律的独特需求。我们提出了一种架构,包括由LLM驱动的自动形式化,扩展了Catala的形式化法律演算,一个验证内核,以及基于形式化证明轨迹的解释生成。对于法律的计算性组成部分,该架构提供了可证明的正确性。对于开放结构的法律分析,它提供了结构性保证:法律论证的每个必要阶段都得到处理,论证在正确阶段进行且不遗漏,步骤之间的演绎链接有效。我们在德国法律的程序性期限计算、美国宪法中的商业条款分析以及跨司法管辖区的制裁比例性上展示了该架构。我们进一步表明,相同的架构对法律AI训练具有结构性优势:一个确定性的外部验证器为法律问题提供可验证的结果,从而弥补了法律中传统强化学习循环的差距。
查看缓存全文
缓存时间: 2026/06/24 07:49
# 闭环:以形式化验证的法律作为自我改进型法律AI的奖励信号 来源:https://arxiv.org/abs/2606.23913 查看 PDF(https://arxiv.org/pdf/2606.23913) > 摘要:本文构建了一种架构,能够生成形式上可验证的奖励信号,用于训练法律AI,并将数学AI领域“LLM提议,验证者裁决”的范式适配至法律领域的独特需求。我们提出的架构包括:LLM驱动的自动形式化(转化为扩展了Catala的形式化法律演算)、验证内核,以及基于形式化证明轨迹的解释生成。对于法律中的计算性组件,该架构提供了可证明的正确性;对于开放性法律分析,它则提供结构性保障:法律论证的每个必要阶段均被涵盖,论证在正确阶段展开且不缺失,步骤间的演绎连接有效。我们在德国法律中的程序期限计算、美国宪法中的商业条款分析,以及跨司法辖区的制裁比例性问题上对该架构进行了演示。我们进一步证明,同一架构在法律AI训练方面具有结构性优势:确定性外部验证器为法律问题提供可验证的结果,从而弥合了法律领域中传统强化学习循环的缺口。 ## 提交历史 来自:Torben Leowald \[查看电子邮件(https://arxiv.org/show-email/40f6527b/2606.23913)\] **\[v1\]** 2026年6月22日,星期一,20:21:49 UTC(309 KB)
相似文章
形式化方法遇上大语言模型:面向先进AI系统合规性的审计、监控与干预
本文提出了一种将形式化方法(线性时序逻辑)与大语言模型相结合的技术,用于审计、监控和干预AI系统以确保其符合行为约束。研究表明,即便是小模型标注器在检测违规行为方面也能媲美前沿大语言模型裁判。
哪些变化重要?通过相关性敏感评估和求解器推理实现可信赖的法律AI
本文介绍了一套用于法律AI的相关性敏感评估套件,表明LLM对法律无关的扰动过于敏感,并提出LexGuard,一个基于形式推理的对抗性多代理框架,以提高法律推理的可靠性。
连接法律解释与形式逻辑:忠实性、假设与人工智能法律推理的未来
本文指出了人工智能法律推理中法律解释与形式逻辑之间的系统性鸿沟,提出了一种神经符号方法来弥合这一鸿沟,并展示了在严格形式蕴含条件下重新标注法律自然语言推理数据时出现的显著标签偏移。
当规则学习:一种用于法律案例检索的自我进化智能体
本文介绍了一种自我进化框架,该框架利用基于LLM的智能体,为法律案例检索中的BM25迭代创建并优化查询重写规则,在无需任何参数训练的情况下,在LeCaRD-v2基准上优于非进化基线。
为法律专业人士定制模型
法律专业人士生成式AI平台Harvey与OpenAI合作,创建了一个定制训练的案例法模型,该模型减少了幻觉现象,改善了文件起草和合同分析等复杂法律任务的推理能力。该定制模型在10亿个美国案例法令牌上进行了训练,在律师偏好度测试中超过标准基础模型97%。