@Kseniase_: EBM强势回归!@ylecun多年来一直指出:AI推理需要先检查结构再作答的系统……
摘要
Aleph 是一个新型形式化推理AI系统,在主要基准测试中领先,证实了 Yann LeCun 对基于能量模型(EBM)的AI推理的强调。
查看缓存全文
缓存时间: 2026/05/16 15:21
EBM 强势回归!
@ylecun 多年来一直强调:AI 推理需要系统在回答之前先检查结构。
来自 @logic_int 的 Aleph 现在在主要形式推理基准测试中领先——让我解释一下这是什么 -> 📺 https://t.co/4D3fqtjfL4
相似文章
@logic_int: Aleph,我们全自主的AI智能体系统,用于形式验证,在所有主要定理证明基准测试中表现出色,包括…
Aleph,一个全自主的AI智能体系统,用于形式验证,在包括PutnamBench、VeriSoftBench和Verina在内的主要定理证明基准测试中取得了顶尖性能。
对于AI推理的“只需增加更多算力”的论点正变得越来越令人厌倦。
对AI推理扩展论点的一个批判性观点,认为自回归LLM无法仅通过增加计算量来实现正确性,并强调替代架构如EBM和形式验证在关键应用中更为优越。
@logic_int: 新消息:Aleph Prover 已形式化 OpenAI 对保罗·埃尔德什平面单位问题的反证。我们正在发布形式化…
Aleph Prover 已在 Lean 4 中形式化了 OpenAI 对保罗·埃尔德什平面单位问题的反证,并将其作为开源发布以供独立验证,展示了人工智能在加速数学研究中的作用,同时提供了可验证的证明数据。
@ylecun: 人们意识到,人工智能远不及人类的智能和学习能力。然而,它们已经变得非常有用...
Yann LeCun 观察到,当前的人工智能系统虽然远未达到人类水平的智能和学习能力,但通过积累大量陈述性知识来弥补自身在常识、推理和规划能力上的不足,已经变得非常有用,这一现象引发了关于AI能力的讨论。
@rohanpaul_ai: Google DeepMind 的新论文。表明人工智能现在可以搜索形式化数学证明,但仅限于精心限制的范围内……
Google DeepMind 的新论文介绍了 AlphaProof Nexus,这是一个结合了 LLM 与 Lean 证明检查器的 AI 系统,用于在受限的数学领域中搜索形式化证明。该系统解决了来自 Erdős 和 OEIS 集合的几个未解问题,展示了一种新的分工:AI 提出候选证明,验证器确保正确性。