mathematical-reasoning

标签

Cards List
#mathematical-reasoning

通过过程监督改进数学推理

OpenAI Blog · 2023-05-31 缓存

OpenAI 展示了过程监督——对中间推理步骤而非仅对最终答案进行奖励——如何改进数学推理,同时降低对齐成本。这种方法在不牺牲模型性能的前提下,产生更易解释、更符合人类价值观的推理过程。

0 人收藏 0 人点赞
#mathematical-reasoning

用于自动定理证明的生成语言建模

OpenAI Blog · 2020-09-07 缓存

# 用于自动定理证明的生成语言建模 来源: [https://openai.com/index/generative-language-modeling-for-automated-theorem-proving/](https://openai.com/index/generative-language-modeling-for-automated-theorem-proving/) OpenAI## 摘要 我们探索了基于 Transformer 的语言模型在自动定理证明中的应用。这项工作的动力来自于一种可能性,即自动定理证明器与人类相比的一个主要局限——原始内容的生成

0 人收藏 0 人点赞
← Previous
← 返回首页

提交意见反馈