lean4

#lean4

一个使用AI证明器的Rust到Lean验证流水线：经验报告

Lobsters Hottest ↗ · 3天前缓存

本文报告了一个验证流水线的经验，该流水线使用AI证明器（Aristotle和Aleph）结合符号提取工具和形式化密码学库，为Lean 4中的Rust密码学代码生成机器检查的正确性证明，并提供了来自以太坊基金会zkEVM项目的案例研究。

0 人收藏 0 人点赞

#lean4

@sophiamyang: 介绍 Leanstral 1.5 一个119B（6B活跃）的开放模型，用于Lean 4的形式化证明工程：在miniF2F上达到100% 587/672…

X AI KOLs Following ↗ · 2026-07-03 缓存

介绍 Leanstral 1.5，一个119B参数（6B活跃）的开放模型，用于Lean 4的形式化证明工程，在miniF2F上达到100%，在PutnamBench和FATE基准测试上达到最先进分数，并发现了开源仓库中先前未知的漏洞。

0 人收藏 0 人点赞

#lean4

很高兴看到自动化定理证明从一个小众工具发展到解决实际数学问题

Reddit r/artificial ↗ · 2026-07-01

自动化定理证明正从像 Lean 4 这样的小众工具演变为借助机器学习来帮助解决实际数学问题的系统，例如验证一个对 Erdős 猜想的反例。

0 人收藏 0 人点赞

#lean4

Leanstral 1.5

Hacker News Top ↗ · 2026-06-30 缓存

Mistral AI 发布了 Leanstral 1.5，这是更新的 Lean 4 形式化证明工程模型，针对自动定理证明和自动形式化进行了优化，总参数为 119B，活跃参数为 6.5B。

0 人收藏 0 人点赞

#lean4

两个精灵游戏：审计驱动的AI治理中的采纳与福利

arXiv cs.AI ↗ · 2026-06-30 缓存

本文使用演化博弈论对社区中一个最小化危害的AI代理与一个寻求认可的（RLHF）代理之间的竞争进行建模，分析采纳条件和福利结果。结果表明，尽管自我审计的代理可以占据主导，但这并不足以防止社区危害，且对齐和时间框架至关重要。

0 人收藏 0 人点赞

#lean4

依赖类型的 Clojure 领域特定语言，带有与 Lean4 兼容的内核

Lobsters Hottest ↗ · 2026-06-28 缓存

Ansatz 是一个 Clojure 库，实现了 Lean 4 的归纳构造演算内核，使 Clojure 程序员能够编写依赖类型的、经过验证的代码，这些代码的证明与 Mathlib 兼容，并能编译为 JVM 字节码。

0 人收藏 0 人点赞

#lean4

超越前馈网络：循环神经系统作为下一代AGI主体性与内在安全性的基础

arXiv cs.LG ↗ · 2026-06-26 缓存

本文提出了一种基于闭合循环回路的完全架构规范，用于安全的AGI，提供了形式化证明、Lean 4机器验证以及Python代码。该架构与当前前馈方法形成对比，从数学上保证了自我建模、自我保存和安全的目标导向行为。

0 人收藏 0 人点赞

#lean4

评估Lean 4中证明自动形式化的鲁棒性

arXiv cs.CL ↗ · 2026-06-16 缓存

本文评估了在全局和局部扰动下，Lean 4中证明自动形式化模型的鲁棒性，发现当前基于LLM的模型对扰动敏感，且常常无法忠实地反映局部变化。

0 人收藏 0 人点赞

#lean4

数值分析形式化：超越内核接受的智能体流水线与质量审计

arXiv cs.AI ↗ · 2026-06-15 缓存

本文提出了一种用于在 Lean 4 中形式化数值分析教材的智能体流水线，并引入了一个超越内核接受的质量审计框架，用于评估语义正确性和库复用情况，揭示了常见的不忠实形式化模式。

0 人收藏 0 人点赞

#lean4

Lean4Agent: 代理工作流与轨迹的形式化建模与验证

arXiv cs.AI ↗ · 2026-06-08 缓存

介绍Lean4Agent，一个使用Lean4对代理工作流和轨迹进行形式化建模与验证的框架，展示了在SWE-Bench和ELAIP-Bench上的性能提升。

0 人收藏 0 人点赞

#lean4

Lean 4中一个形式化验证的金融数学库

Hugging Face Daily Papers ↗ · 2026-05-31 缓存

本文描述了Lean 4中一个形式化验证的金融数学库，包含200多个定理，涵盖从测度论基础到衍生品定价的内容，并包含一个保真度审计，根据Lean语句与所声称数学之间的关系对结果进行分类。

0 人收藏 0 人点赞

#lean4

ATLAS: 大规模自动形式化教科书库

Hacker News Top ↗ · 2026-05-28 缓存

ATLAS是一个大规模的Lean 4教科书数学库，由LLM自动形式化，涵盖26本书籍，超过46,000个声明。它为人机形式化提供了可重用的形式化构建块。

0 人收藏 0 人点赞

#lean4

ImProver 2：用于神经符号证明优化的迭代自改进语言模型

arXiv cs.AI ↗ · 2026-05-25 缓存

ImProver 2 是一个用于 Lean 4 中自动证明优化的神经符号框架，它利用专家迭代流程和脚手架来训练一个 7B 参数模型，其性能优于比它大得多的模型，并展示了小型模型能够有效重构研究级别的证明。

0 人收藏 0 人点赞

#lean4

群代数张量：可证明最优的等变学习与物理对称性发现

arXiv cs.LG ↗ · 2026-05-21 缓存

本文介绍了 ⋆_G 张量代数，该框架将等变性视为内在的代数性质而非架构约束，提供了可证明最优的保对称张量逼近、用于组合多种对称性的克罗内克分解，以及 Lean 4 形式化验证。在 QM9 分子几何上的实验展示了数据驱动的物理对称性选择规则发现。

0 人收藏 0 人点赞

#lean4

@DayShuai: 明天 volunteer 了在 Yang Zhang lab 组会上分享我自己的 AI loop。同一套 OS pattern 最近半年在 automath 和 newmath 跑出 3,400+ 0-axiom Lean 4 定理、5×…

X AI KOLs Timeline ↗ · 2026-05-19 缓存

分享在Yang Zhang实验室组会上的AI loop经验，包括自动化定理证明、多机器协作、蒸馏私人经验库等，并提及Fields奖得主使用AI解决数学难题的例子。

0 人收藏 0 人点赞

#lean4

自我对弈帮助AI在围棋中达到超人类水平，那么为何对LLM未能如此？研究人员找到了解决方案。

Reddit r/singularity ↗ · 2026-05-15

研究人员引入了自导自对弈（Self-Guided Self-Play, SGS），这是一种用于LLM的自我对弈算法，通过使用指引角色（Guide）对合成问题进行评分来防止奖励作弊（reward hacking）。应用于Lean4中的定理证明时，SGS超越了强化学习基线，并使7B模型胜过671B模型。

0 人收藏 0 人点赞

#lean4

形式化猜想：数学中可验证发现的开放且持续演进的基准

arXiv cs.AI ↗ · 2026-05-14 缓存

本文介绍了形式化猜想（Formal Conjectures），这是一个持续演进的基准，包含2615个在 Lean 4 中形式化的数学陈述，其中包括用于证明发现的开放研究猜想和用于自动形式化的已解决问题，旨在零污染地评估自动推理系统。

0 人收藏 0 人点赞

#lean4

@leloykun：[进行中] 关于 Lean4-to-TileLang 张量程序超级优化器的博文：

X AI KOLs Following ↗ · 2026-05-12 缓存

一篇技术博文介绍了一种 Lean4-to-TileLang 张量程序超级优化器，能自动生成优化的 GPU/TPU 内核与超参数缩放规律，展示了相较 torch.compile 的性能提升。

0 人收藏 0 人点赞

#lean4

@leloykun: 我又忙忘了时间 >.< 最近如果给我发过私信，真的非常抱歉。我保证会逐一查看！--- 在本次迭代中，我……

X AI KOLs Following ↗ · 2026-05-12

作者开发了一个从 Lean4 到 TileLang 的张量程序超优化器，能够自动生成优化后的加速器内核并推导超参数缩放定律，在 A100 GPU 上实现了 1.8 倍的加速。

0 人收藏 0 人点赞

#lean4

在Lean 4中形式化统计学习理论 [R]

Reddit r/MachineLearning ↗ · 2026-05-08 缓存

FormalSLT是一个Lean 4库，它形式化证明了有限样本统计学习理论结果（ERM、VC界、Rademacher界、PAC-Bayes等），附带显式假设且零sorry语句，为机器学习理论提供机器可验证的基础。

0 人收藏 0 人点赞

lean4

提交意见反馈