闭环：形式化验证的法律作为自我改进法律AI的奖励信号

arXiv cs.LG 2026/06/24 04:00 论文

legal-ai formal-verification reward-signal machine-learning reinforcement-learning llm autoformalization

摘要

本文提出了一种架构，该架构使用形式化验证的法律作为训练法律AI的奖励信号，自适应地将法律规则自动形式化为形式化演算，并采用验证器确保可证明的正确性，在德国和美国法律示例上进行了演示。

arXiv:2606.23913v1 公告类型：新摘要：本文开发了一种架构，该架构创建了一个可形式化验证的奖励信号来训练法律AI，将数学AI中“LLM提出，验证器处置”的范式适配到法律的独特需求。我们提出了一种架构，包括由LLM驱动的自动形式化，扩展了Catala的形式化法律演算，一个验证内核，以及基于形式化证明轨迹的解释生成。对于法律的计算性组成部分，该架构提供了可证明的正确性。对于开放结构的法律分析，它提供了结构性保证：法律论证的每个必要阶段都得到处理，论证在正确阶段进行且不遗漏，步骤之间的演绎链接有效。我们在德国法律的程序性期限计算、美国宪法中的商业条款分析以及跨司法管辖区的制裁比例性上展示了该架构。我们进一步表明，相同的架构对法律AI训练具有结构性优势：一个确定性的外部验证器为法律问题提供可验证的结果，从而弥补了法律中传统强化学习循环的差距。

查看原文

查看缓存全文

缓存时间: 2026/06/24 07:49

# 闭环：以形式化验证的法律作为自我改进型法律AI的奖励信号
来源：https://arxiv.org/abs/2606.23913
查看 PDF（https://arxiv.org/pdf/2606.23913）

> 摘要：本文构建了一种架构，能够生成形式上可验证的奖励信号，用于训练法律AI，并将数学AI领域“LLM提议，验证者裁决”的范式适配至法律领域的独特需求。我们提出的架构包括：LLM驱动的自动形式化（转化为扩展了Catala的形式化法律演算）、验证内核，以及基于形式化证明轨迹的解释生成。对于法律中的计算性组件，该架构提供了可证明的正确性；对于开放性法律分析，它则提供结构性保障：法律论证的每个必要阶段均被涵盖，论证在正确阶段展开且不缺失，步骤间的演绎连接有效。我们在德国法律中的程序期限计算、美国宪法中的商业条款分析，以及跨司法辖区的制裁比例性问题上对该架构进行了演示。我们进一步证明，同一架构在法律AI训练方面具有结构性优势：确定性外部验证器为法律问题提供可验证的结果，从而弥合了法律领域中传统强化学习循环的缺口。

## 提交历史

来自：Torben Leowald \[查看电子邮件（https://arxiv.org/show-email/40f6527b/2606.23913）\] **\[v1\]** 2026年6月22日，星期一，20:21:49 UTC（309 KB）

闭环：形式化验证的法律作为自我改进法律AI的奖励信号

相似文章

形式化方法遇上大语言模型：面向先进AI系统合规性的审计、监控与干预

哪些变化重要？通过相关性敏感评估和求解器推理实现可信赖的法律AI

连接法律解释与形式逻辑：忠实性、假设与人工智能法律推理的未来

当规则学习：一种用于法律案例检索的自我进化智能体

为法律专业人士定制模型

提交意见反馈