reasoning-model

#reasoning-model

ZAYA1-8B 技术报告

arXiv cs.AI ↗ · 2天前缓存

本报告介绍了 ZAYA1-8B，这是一款在 AMD 硬件上训练的混合专家推理模型，使用少于 10 亿的激活参数在数学和编程基准测试中取得了具有竞争力的性能。报告还详细介绍了马尔可夫式 RSA（Markovian RSA），这是一种用于聚合并行推理轨迹的新型测试时计算（test-time compute）方法。

0 人收藏 1 人点赞

#reasoning-model

@sailfishcc1: 问了几百个 5.4 Pro 的问题，我能明显的感受到它绝对是 5.5 thinking xhigh，绝对不是 5.5 Pro 模型，这也体现出 OpenAI 对于 5.5 模型的自信，它认为 5.5 thinking 要比 5.4 Pro…

X AI KOLs Following ↗ · 2026-04-21 缓存

User testing indicates the new 5.4 Pro model is actually a disguised 5.5-thinking-xhigh, suggesting OpenAI is quietly rolling out stronger reasoning capabilities to Pro subscribers.

0 人收藏 0 人点赞

#reasoning-model

@OpenAI: 推出 GPT-Rosalind，我们的前沿推理模型，旨在支持生物学、药物发现及转…

X AI KOLs ↗ · 2026-04-16 缓存

OpenAI 推出 GPT-Rosalind，这是一个前沿推理模型，专门设计用于支持生物学、药物发现和转化医学领域的研究。

0 人收藏 0 人点赞

#reasoning-model

# 介绍 GPT-5.4 Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/) 今天，我们在 ChatGPT（作为 GPT‑5\.4 Thinking）、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**，适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。

0 人收藏 0 人点赞

#reasoning-model

GPT-5.4 Thinking 系统卡

OpenAI Blog ↗ · 2026-03-05 缓存

OpenAI发布了GPT-5.4 Thinking，这是GPT-5系列中最新推出的推理模型，具备增强的安全缓解措施，尤其值得一提的是，该模型是首个实现全面网络安全保护措施的通用模型。

0 人收藏 0 人点赞

#reasoning-model

推出 GPT-5.2

OpenAI Blog ↗ · 2025-12-11 缓存

OpenAI 推出 GPT-5.2，这是目前最强大的模型系列，在知识工作、代码生成、图像理解、长上下文理解和工具调用方面都有显著提升。GPT-5.2 Thinking 变体在专业基准测试中达到最先进的性能，在 44 个职业的 GDPval 任务中，70.9% 的表现超越了人类专家。

0 人收藏 0 人点赞

#reasoning-model

面向开发者推出GPT-5.1

OpenAI Blog ↗ · 2025-11-13 缓存

OpenAI发布了GPT-5.1，这是GPT-5系列中的一个新模型，它可以基于任务复杂度动态调整思考时间，在保持前沿智能的同时，性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存（24小时保留）、新的编码工具（apply_patch和shell），以及针对延迟敏感应用的“无推理”模式。

0 人收藏 0 人点赞

#reasoning-model

gpt-oss-120b & gpt-oss-20b 模型卡

OpenAI Blog ↗ · 2025-08-05 缓存

OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b，这是两款采用 Apache 2.0 许可证的开权重推理模型，专为智能体工作流设计，具有强大的指令跟随、工具使用和思维链能力。该发布包括全面的安全评估，确认即使在对抗性微调下，这些模型也不会达到生物、化学或网络风险的高能力阈值。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o3 和 o4-mini 发布

OpenAI Blog ↗ · 2025-04-16 缓存

OpenAI 发布了最新的推理模型 o3 和 o4-mini，可以自主访问和组合所有 ChatGPT 工具（网络搜索、代码执行、图像分析、图像生成）。o3 在编程、数学和科学基准测试中达到业界最先进水平，主要错误比 o1 少 20%，而 o4-mini 则提供成本和速度优化的高效推理能力。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o3-mini

OpenAI Blog ↗ · 2025-01-31 缓存

OpenAI 发布 o3-mini，一款成本高效的推理模型，具备强大的 STEM 能力，现已在 ChatGPT 和 API 中可用，支持函数调用、结构化输出和三个推理力度级别。该模型在数学和编码方面与 o1 性能相当，同时更快且更便宜，免费计划用户首次获得推理模型的访问权限。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o1 和开发者新工具

OpenAI Blog ↗ · 2024-12-17 缓存

OpenAI 向 API 发布 o1 模型，具备生产就绪的功能，包括函数调用、结构化输出、视觉能力，以及比 o1-preview 低 60% 的延迟。其他开发者工具包括 Realtime API 改进、偏好微调，以及新的 Go 和 Java SDK。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o1 发布

OpenAI Blog ↗ · 2024-09-12 缓存

OpenAI 发布了 o1，一系列新的推理导向型 AI 模型，在科学、编码和数学等复杂任务上表现优于前代模型。预览版模型在国际数学奥林匹克竞赛问题上的解决率达到 83%，而 GPT-4o 仅为 13%，在竞技编程中达到第 89 个百分位。

0 人收藏 0 人点赞

#reasoning-model

OpenAI o1-mini

OpenAI Blog ↗ · 2024-09-12 缓存

OpenAI 发布了 o1-mini，一款成本高效的推理模型，在数学和编码等 STEM 任务上与 o1 性能相当，但价格便宜 80%。该模型针对推理密集型应用进行了优化，现已向 API 用户和 ChatGPT Plus/Team/Enterprise/Edu 订阅者开放。

0 人收藏 0 人点赞

#reasoning-model

用 OpenAI o1 解码遗传学

OpenAI Blog ↗ · 2024-09-12 缓存

# 用 OpenAI o1 解码遗传学来源: [https://openai.com/index/o1-genetics/](https://openai.com/index/o1-genetics/) 2024年9月12日 ChatGPT ## Catherine Brownstein: OpenAI o1 与遗传学认识一下 OpenAI o1——新系列 AI 模型，设计用于在响应前花更多时间思考。这个新系列 AI 模型能够推理复杂任务，并在科学、编码和数学方面解决比之前模型更难的问题。

0 人收藏 0 人点赞

reasoning-model

提交意见反馈