reasoning-model

标签

Cards List
#reasoning-model

OpenAI 声称解决了80年前的数学难题——这次是真的

TechCrunch AI · 2026-05-20 缓存

OpenAI 声称其新推理模型自主生成了一个原创数学证明,推翻了保罗·埃尔德什(Paul Erdős)一个80年未解的几何猜想。这标志着人工智能首次解决了一个数学领域核心的著名开放问题。

0 人收藏 0 人点赞
#reasoning-model

OpenAI模型推翻离散几何核心猜想

Hacker News Top · 2026-05-20 缓存

OpenAI的一个模型自主推翻了离散几何中的核心猜想——单位距离问题,这是人工智能首次解决数学领域的重要开放问题。

0 人收藏 0 人点赞
#reasoning-model

@Sapient_Int: 推出 HRM-Text。一个超精简的 1B 参数推理语言模型,旨在提供强大的通用性能…

X AI KOLs Timeline · 2026-05-18 缓存

Sapient Intelligence 推出 HRM-Text,这是一个 1B 参数的推理语言模型,仅使用 40B tokens 训练,预算为 1000 美元,在大幅减少数据和计算需求的同时实现了具有竞争力的性能。

0 人收藏 0 人点赞
#reasoning-model

Ring-2.6-1T 在真实世界智能体任务中达到 SOTA 水平

Reddit r/ArtificialInteligence · 2026-05-18

蚂蚁集团发布了 Ring-2.6-1T,这是一个拥有 1 万亿参数的推理模型,专为智能体工作流设计,采用 MIT 许可证、扩展上下文,并使用了异步强化学习 (Async RL) 和 IcePop 训练方法,取得了最先进的成果。

0 人收藏 0 人点赞
#reasoning-model

@stingning:我们正在发布一个30B-A3B推理模型,该模型在物理和数学奥林匹克评估中达到了金牌水平……

X AI KOLs Timeline · 2026-05-15 缓存

研究人员发布了SU-01,这是一个30B-A3B推理模型,在物理和数学奥林匹克问题上达到了金牌水平,使用了一种统一的证明搜索缩放方法。

0 人收藏 0 人点赞
#reasoning-model

inclusionAI/Ring-2.6-1T · Hugging Face

Reddit r/LocalLLaMA · 2026-05-14 缓存

inclusionAI发布了Ring-2.6-1T,一个万亿参数推理模型,具有增强的代理执行能力、推理努力机制和异步强化学习训练范式,旨在应对复杂的现实世界任务。

0 人收藏 0 人点赞
#reasoning-model

ZAYA1-8B 技术报告

arXiv cs.AI · 2026-05-08 缓存

本报告介绍了 ZAYA1-8B,这是一款在 AMD 硬件上训练的混合专家推理模型,使用少于 10 亿的激活参数在数学和编程基准测试中取得了具有竞争力的性能。报告还详细介绍了马尔可夫式 RSA(Markovian RSA),这是一种用于聚合并行推理轨迹的新型测试时计算(test-time compute)方法。

0 人收藏 1 人点赞
#reasoning-model

@sailfishcc1: 问了几百个 5.4 Pro 的问题,我能明显的感受到它绝对是 5.5 thinking xhigh,绝对不是 5.5 Pro 模型,这也体现出 OpenAI 对于 5.5 模型的自信,它认为 5.5 thinking 要比 5.4 Pro…

X AI KOLs Following · 2026-04-21 缓存

User testing indicates the new 5.4 Pro model is actually a disguised 5.5-thinking-xhigh, suggesting OpenAI is quietly rolling out stronger reasoning capabilities to Pro subscribers.

0 人收藏 0 人点赞
#reasoning-model

@OpenAI: 推出 GPT-Rosalind,我们的前沿推理模型,旨在支持生物学、药物发现及转…

X AI KOLs · 2026-04-16 缓存

OpenAI 推出 GPT-Rosalind,这是一个前沿推理模型,专门设计用于支持生物学、药物发现和转化医学领域的研究。

0 人收藏 0 人点赞
#reasoning-model

介绍 GPT-5.4

OpenAI Blog · 2026-03-05 缓存

# 介绍 GPT-5.4 Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/) 今天,我们在 ChatGPT(作为 GPT‑5\.4 Thinking)、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**,适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。

0 人收藏 0 人点赞
#reasoning-model

GPT-5.4 Thinking 系统卡

OpenAI Blog · 2026-03-05 缓存

OpenAI发布了GPT-5.4 Thinking,这是GPT-5系列中最新推出的推理模型,具备增强的安全缓解措施,尤其值得一提的是,该模型是首个实现全面网络安全保护措施的通用模型。

0 人收藏 0 人点赞
#reasoning-model

推出 GPT-5.2

OpenAI Blog · 2025-12-11 缓存

OpenAI 推出 GPT-5.2,这是目前最强大的模型系列,在知识工作、代码生成、图像理解、长上下文理解和工具调用方面都有显著提升。GPT-5.2 Thinking 变体在专业基准测试中达到最先进的性能,在 44 个职业的 GDPval 任务中,70.9% 的表现超越了人类专家。

0 人收藏 0 人点赞
#reasoning-model

面向开发者推出GPT-5.1

OpenAI Blog · 2025-11-13 缓存

OpenAI发布了GPT-5.1,这是GPT-5系列中的一个新模型,它可以基于任务复杂度动态调整思考时间,在保持前沿智能的同时,性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存(24小时保留)、新的编码工具(apply_patch和shell),以及针对延迟敏感应用的“无推理”模式。

0 人收藏 0 人点赞
#reasoning-model

gpt-oss-120b & gpt-oss-20b 模型卡

OpenAI Blog · 2025-08-05 缓存

OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b,这是两款采用 Apache 2.0 许可证的开权重推理模型,专为智能体工作流设计,具有强大的指令跟随、工具使用和思维链能力。该发布包括全面的安全评估,确认即使在对抗性微调下,这些模型也不会达到生物、化学或网络风险的高能力阈值。

0 人收藏 0 人点赞
#reasoning-model

OpenAI o3 和 o4-mini 发布

OpenAI Blog · 2025-04-16 缓存

OpenAI 发布了最新的推理模型 o3 和 o4-mini,可以自主访问和组合所有 ChatGPT 工具(网络搜索、代码执行、图像分析、图像生成)。o3 在编程、数学和科学基准测试中达到业界最先进水平,主要错误比 o1 少 20%,而 o4-mini 则提供成本和速度优化的高效推理能力。

0 人收藏 0 人点赞
#reasoning-model

OpenAI o3-mini

OpenAI Blog · 2025-01-31 缓存

OpenAI 发布 o3-mini,一款成本高效的推理模型,具备强大的 STEM 能力,现已在 ChatGPT 和 API 中可用,支持函数调用、结构化输出和三个推理力度级别。该模型在数学和编码方面与 o1 性能相当,同时更快且更便宜,免费计划用户首次获得推理模型的访问权限。

0 人收藏 0 人点赞
#reasoning-model

OpenAI o1 和开发者新工具

OpenAI Blog · 2024-12-17 缓存

OpenAI 向 API 发布 o1 模型,具备生产就绪的功能,包括函数调用、结构化输出、视觉能力,以及比 o1-preview 低 60% 的延迟。其他开发者工具包括 Realtime API 改进、偏好微调,以及新的 Go 和 Java SDK。

0 人收藏 0 人点赞
#reasoning-model

OpenAI o1 发布

OpenAI Blog · 2024-09-12 缓存

OpenAI 发布了 o1,一系列新的推理导向型 AI 模型,在科学、编码和数学等复杂任务上表现优于前代模型。预览版模型在国际数学奥林匹克竞赛问题上的解决率达到 83%,而 GPT-4o 仅为 13%,在竞技编程中达到第 89 个百分位。

0 人收藏 0 人点赞
#reasoning-model

OpenAI o1-mini

OpenAI Blog · 2024-09-12 缓存

OpenAI 发布了 o1-mini,一款成本高效的推理模型,在数学和编码等 STEM 任务上与 o1 性能相当,但价格便宜 80%。该模型针对推理密集型应用进行了优化,现已向 API 用户和 ChatGPT Plus/Team/Enterprise/Edu 订阅者开放。

0 人收藏 0 人点赞
#reasoning-model

用 OpenAI o1 解码遗传学

OpenAI Blog · 2024-09-12 缓存

# 用 OpenAI o1 解码遗传学 来源: [https://openai.com/index/o1-genetics/](https://openai.com/index/o1-genetics/) 2024年9月12日 ChatGPT ## Catherine Brownstein: OpenAI o1 与遗传学 认识一下 OpenAI o1——新系列 AI 模型,设计用于在响应前花更多时间思考。这个新系列 AI 模型能够推理复杂任务,并在科学、编码和数学方面解决比之前模型更难的问题。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈