generative-verifier

标签

Cards List
#generative-verifier

Maxproof

Hacker News Top · 4天前 缓存

MaxProof 引入了一种测试时缩放框架,该框架结合了证明生成、验证和修复,使用生成-验证器强化学习,使 M3 模型在 IMO 2025 和 USAMO 2026 上超过了人类金牌阈值。

0 人收藏 0 人点赞
#generative-verifier

MaxProof: 基于生成验证器强化学习与群体级测试时扩展的数学证明方法

Hugging Face Daily Papers · 5天前 缓存

MaxProof 是一个测试时扩展框架,它利用生成验证器和群体级搜索来增强数学证明生成,在 IMO 2025 和 USAMO 2026 上取得了超过人类金牌阈值的分数。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈