reasoning-model

#reasoning-model

OpenAI 声称解决了80年前的数学难题——这次是真的

TechCrunch AI ↗ · 2026-05-20 缓存

OpenAI 声称其新推理模型自主生成了一个原创数学证明，推翻了保罗·埃尔德什（Paul Erdős）一个80年未解的几何猜想。这标志着人工智能首次解决了一个数学领域核心的著名开放问题。

0 人收藏 0 人点赞

#reasoning-model

OpenAI模型推翻离散几何核心猜想

Hacker News Top ↗ · 2026-05-20 缓存

OpenAI的一个模型自主推翻了离散几何中的核心猜想——单位距离问题，这是人工智能首次解决数学领域的重要开放问题。

0 人收藏 0 人点赞

#reasoning-model

@Sapient_Int: 推出 HRM-Text。一个超精简的 1B 参数推理语言模型，旨在提供强大的通用性能…

X AI KOLs Timeline ↗ · 2026-05-18 缓存

Sapient Intelligence 推出 HRM-Text，这是一个 1B 参数的推理语言模型，仅使用 40B tokens 训练，预算为 1000 美元，在大幅减少数据和计算需求的同时实现了具有竞争力的性能。

0 人收藏 0 人点赞

#reasoning-model

Ring-2.6-1T 在真实世界智能体任务中达到 SOTA 水平

Reddit r/ArtificialInteligence ↗ · 2026-05-18

蚂蚁集团发布了 Ring-2.6-1T，这是一个拥有 1 万亿参数的推理模型，专为智能体工作流设计，采用 MIT 许可证、扩展上下文，并使用了异步强化学习 (Async RL) 和 IcePop 训练方法，取得了最先进的成果。

0 人收藏 0 人点赞

#reasoning-model

@stingning：我们正在发布一个30B-A3B推理模型，该模型在物理和数学奥林匹克评估中达到了金牌水平……

X AI KOLs Timeline ↗ · 2026-05-15 缓存

研究人员发布了SU-01，这是一个30B-A3B推理模型，在物理和数学奥林匹克问题上达到了金牌水平，使用了一种统一的证明搜索缩放方法。

0 人收藏 0 人点赞

#reasoning-model

inclusionAI/Ring-2.6-1T · Hugging Face

Reddit r/LocalLLaMA ↗ · 2026-05-14 缓存

inclusionAI发布了Ring-2.6-1T，一个万亿参数推理模型，具有增强的代理执行能力、推理努力机制和异步强化学习训练范式，旨在应对复杂的现实世界任务。

0 人收藏 0 人点赞

#reasoning-model

ZAYA1-8B 技术报告

arXiv cs.AI ↗ · 2026-05-08 缓存

本报告介绍了 ZAYA1-8B，这是一款在 AMD 硬件上训练的混合专家推理模型，使用少于 10 亿的激活参数在数学和编程基准测试中取得了具有竞争力的性能。报告还详细介绍了马尔可夫式 RSA（Markovian RSA），这是一种用于聚合并行推理轨迹的新型测试时计算（test-time compute）方法。

0 人收藏 1 人点赞

#reasoning-model

@sailfishcc1: 问了几百个 5.4 Pro 的问题，我能明显的感受到它绝对是 5.5 thinking xhigh，绝对不是 5.5 Pro 模型，这也体现出 OpenAI 对于 5.5 模型的自信，它认为 5.5 thinking 要比 5.4 Pro…

X AI KOLs Following ↗ · 2026-04-21 缓存

User testing indicates the new 5.4 Pro model is actually a disguised 5.5-thinking-xhigh, suggesting OpenAI is quietly rolling out stronger reasoning capabilities to Pro subscribers.

0 人收藏 0 人点赞

#reasoning-model

@OpenAI: 推出 GPT-Rosalind，我们的前沿推理模型，旨在支持生物学、药物发现及转…

X AI KOLs ↗ · 2026-04-16 缓存

OpenAI 推出 GPT-Rosalind，这是一个前沿推理模型，专门设计用于支持生物学、药物发现和转化医学领域的研究。

0 人收藏 0 人点赞

#reasoning-model

# 介绍 GPT-5.4 Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/) 今天，我们在 ChatGPT（作为 GPT‑5\.4 Thinking）、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**，适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。

0 人收藏 0 人点赞

#reasoning-model

GPT-5.4 Thinking 系统卡

OpenAI Blog ↗ · 2026-03-05 缓存

OpenAI发布了GPT-5.4 Thinking，这是GPT-5系列中最新推出的推理模型，具备增强的安全缓解措施，尤其值得一提的是，该模型是首个实现全面网络安全保护措施的通用模型。

0 人收藏 0 人点赞

#reasoning-model

推出 GPT-5.2

OpenAI Blog ↗ · 2025-12-11 缓存

OpenAI 推出 GPT-5.2，这是目前最强大的模型系列，在知识工作、代码生成、图像理解、长上下文理解和工具调用方面都有显著提升。GPT-5.2 Thinking 变体在专业基准测试中达到最先进的性能，在 44 个职业的 GDPval 任务中，70.9% 的表现超越了人类专家。

0 人收藏 0 人点赞

#reasoning-model

面向开发者推出GPT-5.1

OpenAI Blog ↗ · 2025-11-13 缓存

OpenAI发布了GPT-5.1，这是GPT-5系列中的一个新模型，它可以基于任务复杂度动态调整思考时间，在保持前沿智能的同时，性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存（24小时保留）、新的编码工具（apply_patch和shell），以及针对延迟敏感应用的“无推理”模式。

0 人收藏 0 人点赞

#reasoning-model

gpt-oss-120b & gpt-oss-20b 模型卡

OpenAI Blog ↗ · 2025-08-05 缓存

OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b，这是两款采用 Apache 2.0 许可证的开权重推理模型，专为智能体工作流设计，具有强大的指令跟随、工具使用和思维链能力。该发布包括全面的安全评估，确认即使在对抗性微调下，这些模型也不会达到生物、化学或网络风险的高能力阈值。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o3 和 o4-mini 发布

OpenAI Blog ↗ · 2025-04-16 缓存

OpenAI 发布了最新的推理模型 o3 和 o4-mini，可以自主访问和组合所有 ChatGPT 工具（网络搜索、代码执行、图像分析、图像生成）。o3 在编程、数学和科学基准测试中达到业界最先进水平，主要错误比 o1 少 20%，而 o4-mini 则提供成本和速度优化的高效推理能力。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o3-mini

OpenAI Blog ↗ · 2025-01-31 缓存

OpenAI 发布 o3-mini，一款成本高效的推理模型，具备强大的 STEM 能力，现已在 ChatGPT 和 API 中可用，支持函数调用、结构化输出和三个推理力度级别。该模型在数学和编码方面与 o1 性能相当，同时更快且更便宜，免费计划用户首次获得推理模型的访问权限。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o1 和开发者新工具

OpenAI Blog ↗ · 2024-12-17 缓存

OpenAI 向 API 发布 o1 模型，具备生产就绪的功能，包括函数调用、结构化输出、视觉能力，以及比 o1-preview 低 60% 的延迟。其他开发者工具包括 Realtime API 改进、偏好微调，以及新的 Go 和 Java SDK。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o1 发布

OpenAI Blog ↗ · 2024-09-12 缓存

OpenAI 发布了 o1，一系列新的推理导向型 AI 模型，在科学、编码和数学等复杂任务上表现优于前代模型。预览版模型在国际数学奥林匹克竞赛问题上的解决率达到 83%，而 GPT-4o 仅为 13%，在竞技编程中达到第 89 个百分位。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o1-mini

OpenAI Blog ↗ · 2024-09-12 缓存

OpenAI 发布了 o1-mini，一款成本高效的推理模型，在数学和编码等 STEM 任务上与 o1 性能相当，但价格便宜 80%。该模型针对推理密集型应用进行了优化，现已向 API 用户和 ChatGPT Plus/Team/Enterprise/Edu 订阅者开放。

0 人收藏 0 人点赞

#reasoning-model

用 OpenAI o1 解码遗传学

OpenAI Blog ↗ · 2024-09-12 缓存

# 用 OpenAI o1 解码遗传学来源: [https://openai.com/index/o1-genetics/](https://openai.com/index/o1-genetics/) 2024年9月12日 ChatGPT ## Catherine Brownstein: OpenAI o1 与遗传学认识一下 OpenAI o1——新系列 AI 模型，设计用于在响应前花更多时间思考。这个新系列 AI 模型能够推理复杂任务，并在科学、编码和数学方面解决比之前模型更难的问题。

0 人收藏 0 人点赞

reasoning-model

提交意见反馈