mathematical-reasoning

#mathematical-reasoning

通过过程监督改进数学推理

OpenAI Blog ↗ · 2023-05-31 缓存

OpenAI 展示了过程监督——对中间推理步骤而非仅对最终答案进行奖励——如何改进数学推理，同时降低对齐成本。这种方法在不牺牲模型性能的前提下，产生更易解释、更符合人类价值观的推理过程。

0 人收藏 0 人点赞

#mathematical-reasoning

# 用于自动定理证明的生成语言建模来源: [https://openai.com/index/generative-language-modeling-for-automated-theorem-proving/](https://openai.com/index/generative-language-modeling-for-automated-theorem-proving/) OpenAI## 摘要我们探索了基于 Transformer 的语言模型在自动定理证明中的应用。这项工作的动力来自于一种可能性，即自动定理证明器与人类相比的一个主要局限——原始内容的生成

0 人收藏 0 人点赞

mathematical-reasoning

通过过程监督改进数学推理

用于自动定理证明的生成语言建模

提交意见反馈