标签
Mistral AI 发布 Leanstral 1.5,一个拥有 6B 激活参数的模型,用于 Lean 4 证明工程,在多个形式化验证基准测试中取得最先进成果,并发现了真实世界中的错误,完全开源,采用 Apache-2.0 许可。
本文提出了一个再形式化的案例研究,使用大型语言模型(LLMs)在证明助手之间(从 Mizar 到 Lean、从 HOL Light 到 Lean 以及从 HOL Light 到 Agda)转移 Jordan Curve Theorem,并分析了实际再形式化任务中的流水线设计选择。
本文应用VGPT-RSI人工智能系统生成与黎曼假设相关的形式化验证的部分结果,包括边界证书和有限Lagarias不等式,同时明确识别剩余数学障碍。
Google新论文提出LEAP框架,将数学问题拆解为目标树,利用Lean验证器反馈进行学习,使LLM在数学竞赛题上的正确率从10%提升至70%,解决了Putnam 2025全部12题,并在IMO基准上超越专用金牌级系统。
本文描述了Lean 4中一个形式化验证的金融数学库,包含200多个定理,涵盖从测度论基础到衍生品定价的内容,并包含一个保真度审计,根据Lean语句与所声称数学之间的关系对结果进行分类。