春季更新

OpenAI Blog 2024/05/13 10:00 模型

gpt-4o multimodal flagship-release audio-vision-text openai reasoning

摘要

OpenAI 发布 GPT-4o，一款新的旗舰模型，能够在音频、视觉和文本等多种模态中进行实时推理。

推出 GPT-4o 并在 ChatGPT 中免费提供更多功能。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:47

# Spring Update Source: https://openai.com/index/spring-update/ ### 你好 GPT‐4o 了解更多关于 GPT‐4o 的信息，这是我们新的旗舰模型，可以实时跨越音频、视觉和文本进行推理。了解更多 (https://openai.com/index/hello-gpt-4o/)

相似文章

Hello GPT-4o

OpenAI Blog

OpenAI发布GPT-4o，一个功能全面的多模态模型，可实时处理音频、视觉、文本和视频，平均音频响应延迟为232毫秒。该模型在文本和代码能力上与GPT-4 Turbo相当，同时显著改进了多语言、音频和视觉功能，API成本降低50%。

GPT-4

OpenAI Blog

OpenAI 发布 GPT-4，一个大型多模态模型，接受图像和文本输入，在专业和学术基准测试中表现出人类水平的性能，在各种评估指标上的表现明显优于 GPT-3.5。

OpenAI o3 和 o4-mini 发布

OpenAI Blog

OpenAI 发布了最新的推理模型 o3 和 o4-mini，可以自主访问和组合所有 ChatGPT 工具（网络搜索、代码执行、图像分析、图像生成）。o3 在编程、数学和科学基准测试中达到业界最先进水平，主要错误比 o1 少 20%，而 o4-mini 则提供成本和速度优化的高效推理能力。

推出 GPT-4.5

OpenAI Blog

OpenAI 推出了 GPT-4.5，这是他们迄今为止最大、最强的聊天模型，作为研究预览版提供给 Pro 用户和开发者使用。该模型通过扩展计算和数据来推进无监督学习，相比 GPT-4o 展现出更好的事实准确性、更少的幻觉现象，以及对人类意图的更深层理解。

# GPT-4.5 系统卡来源：[https://openai.com/index/gpt-4-5-system-card/](https://openai.com/index/gpt-4-5-system-card/) 我们正在发布 OpenAI GPT-4.5 的研究预览版，这是我们迄今为止规模最大、知识最丰富的模型。GPT-4.5 建立在 GPT-4o 的基础上，进一步扩展了预训练规模，设计目标是比我们强大的 STEM 焦点推理模型具有更广泛的适用性。我们采用新的监督技术结合传统方法（如监督微调 (SFT)）来训练该模型

春季更新

相似文章

Hello GPT-4o

GPT-4

OpenAI o3 和 o4-mini 发布

推出 GPT-4.5

OpenAI GPT-4.5 System Card

提交意见反馈