ChatGPT 和 Whisper API 发布
摘要
OpenAI 发布了面向开发者的 ChatGPT(GPT-3.5 Turbo)和 Whisper API,自去年12月以来成本降低了90%,支持集成到第三方应用。公告包括来自 Snap、Quizlet、Instacart、Shop 和 Speak 等早期采用者的案例。
暂无内容
查看缓存全文
缓存时间:
2026/04/20 14:43
# 介绍 ChatGPT 和 Whisper API
来源:https://openai.com/index/introducing-chatgpt-and-whisper-apis/
OpenAI 开发者现在可以通过我们的 API 将 GPT-3.5 Turbo 和 Whisper 模型集成到他们的应用和产品中。
*2024 年 4 月 24 日更新:ChatGPT API 名称已停用。本博客中对 ChatGPT API 的提及指的是 GPT-3.5 Turbo API。*
ChatGPT 和 Whisper 模型现已在我们的 API 上推出,为开发者提供了最先进的语言(不仅仅是聊天!)和语音转文字功能。通过一系列系统级优化,我们自 12 月以来已实现 ChatGPT 的 90% 成本降低;我们现在将这些节省传递给 API 用户。开发者现在可以在 API 中使用我们的开源 Whisper large-v2 模型,获得更快速和更经济的结果。GPT-3.5 API 用户可以期待持续的模型改进以及选择专用容量的选项,以更深入地控制模型。我们也认真听取了开发者的反馈,完善了我们的 API 服务条款,以更好地满足他们的需求。
**Snap Inc**(https://snap.com/en-US)是 Snapchat 的创造者,本周为 Snapchat+ 推出了 My AI。该实验性功能运行在 GPT-3.5 API 上。My AI 为 Snapchatter 提供了一个友好的、可定制的聊天机器人,可以提供推荐,甚至可以在几秒钟内为朋友写出一首俳句。Snapchat 是一个沟通和消息传递的日常平台,拥有 7.5 亿月活跃用户:
**Quizlet**(https://quizlet.com/labs/qchat)是一个全球学习平台,超过 6000 万学生使用它来学习、练习和掌握他们正在学习的内容。Quizlet 在过去三年中与 OpenAI 合作,在包括词汇学习和练习测试在内的多个用例中利用 GPT-3。随着 GPT-3.5 API 的推出,Quizlet 推出了 Q-Chat,这是一个完全自适应的 AI 导师,通过有趣的聊天体验向学生提供基于相关学习材料的自适应问题:
**Instacart**(https://www.instacart.com/)正在增强 Instacart 应用程序,使客户能够询问有关食物的问题并获得启发性的、可购物的答案。这使用 ChatGPT 以及 Instacart 自己的 AI 和来自其 75,000+ 零售合作伙伴门店位置的产品数据,帮助客户为开放式购物目标发现创意,例如"我如何制作美味的鱼玉米卷?"或"对我的孩子来说什么是健康的午餐?"Instacart 计划今年晚些时候推出"Ask Instacart":
**Shop**(https://shop.app/)是 Shopify 的消费者应用,有 1 亿购物者使用它来寻找和接触他们喜爱的产品和品牌。GPT-3.5 API 用于支持 Shop 的新购物助手。当购物者搜索产品时,购物助手根据他们的请求提供个性化推荐。Shop 的新 AI 驱动购物助手将通过扫描数百万产品来简化应用内购物,快速找到买家正在寻找的东西——或帮助他们发现新的东西:
**Speak**(https://www.speak.com/)是一个 AI 驱动的语言学习应用,专注于建立最佳的口语流利度路径。他们是韩国增长最快的英语应用,已经在使用 Whisper API 来支持新的 AI 口语陪练产品,并迅速将其带到全球其他地区。Whisper 对各级别语言学习者的人类级准确度解锁了真正的开放式对话练习和高度准确的反馈:
**模型**:我们今天发布的 ChatGPT 模型系列 `gpt-3.5-turbo` 与 ChatGPT 产品中使用的模型相同。价格为每 1k tokens 0.002 美元,比我们现有的 GPT-3.5 模型便宜 10 倍。它也是许多非聊天用例的最佳模型——我们看到早期测试者从 `text-davinci-003` 迁移到 `gpt-3.5-turbo`,只需对他们的提示进行少量调整。
**API**:传统上,GPT 模型使用非结构化文本,这对模型来说表示为"tokens"序列。ChatGPT 模型改为使用消息序列以及元数据。(对于好奇的人:在幕后,输入仍然呈现给模型作为"tokens"序列供模型使用;模型使用的原始格式是一种名为 Chat Markup Language(https://github.com/openai/openai-python/blob/120d225b91a8453e15240a49fb1c6794d8119326/chatml.md)("ChatML")的新格式。)
我们创建了一个新的端点来与我们的 ChatGPT 模型交互:
我们在不断改进我们的 ChatGPT 模型,并希望向开发者提供这些增强功能。使用 `gpt-3.5-turbo` 模型的开发者将始终获得我们推荐的稳定模型,同时仍然可以灵活地选择特定的模型版本。例如,今天我们发布 `gpt-3.5-turbo-0301`,它将至少支持到 6 月 1 日,我们将在 4 月份更新 `gpt-3.5-turbo` 到新的稳定版本。[模型页面](https://platform.openai.com/docs/models)将提供切换更新。
我们现在也为想要更深入控制特定模型版本和系统性能的用户提供专用实例。默认情况下,请求在与其他用户共享的计算基础设施上运行,这些用户按请求付费。我们的 API 运行在 Azure 上,使用专用实例,开发者将按时间段为为其请求服务的预留计算基础设施分配付费。
开发者可以完全控制实例的负载(更高的负载改进吞吐量但使每个请求更慢),可以启用诸如更长上下文限制之类的功能,以及固定模型快照的能力。
专用实例对于运行超过约 4.5 亿 tokens/天的开发者来说在经济上是有意义的。此外,它能够直接针对硬件性能优化开发者的工作负载,这可以相对于共享基础设施大幅降低成本。如需专用实例查询,[请联系我们](https://openai.com/contact-sales/)。
[Whisper](https://openai.com/index/whisper/) 是我们在 2022 年 9 月开源的语音转文字模型,获得了开发者社区的巨大赞赏,但也可能很难运行。我们现在通过我们的 API 提供了 large-v2 模型,提供了便捷的按需访问,价格为每分钟 0.006 美元。此外,我们高度优化的服务堆栈确保了相比其他服务更快的性能。
Whisper API 通过我们的 `transcriptions`(以源语言转录)或 `translations`(转录为英文)端点可用,并接受多种格式(m4a、mp3、mp4、mpeg、mpga、wav、webm):
在过去的六个月中,我们一直在从我们的 API 客户那里收集反馈,以了解我们如何能更好地为他们服务。我们做出了具体改变,例如:
- 通过 API 提交的数据不再用于服务改进(包括模型训练),除非该组织选择加入
- 为 API 用户实施默认 30 天数据保留政策,并根据用户需求选择更严格的保留
- 移除我们的预启动审查(通过改进我们的自动化监控解锁)
- 改进开发者文档
- 简化我们的[服务条款和使用政策](https://platform.openai.com/docs/usage-policies),包括关于数据所有权的条款:用户拥有模型的输入和输出。
在过去两个月中,我们的正常运行时间没有达到我们自己的期望,也没有达到我们用户的期望。我们工程团队的首要任务现在是生产使用案例的稳定性——我们知道确保 AI 造福全人类需要成为可靠的服务提供商。请在即将到来的几个月中要求我们改进正常运行时间!
我们相信 AI 可以为每个人提供令人难以置信的机会和经济赋权,实现这一目标的最佳方式是让每个人都能够用它进行构建。我们希望今天宣布的这些更改将导致许多应用,每个人都可以受益。开始构建由 ChatGPT 和 Whisper 支持的下一代应用。
相似文章
OpenAI Blog
OpenAI 推出 ChatGPT iOS 应用,提供免费访问、跨设备对话历史同步和 Whisper 语音输入集成。ChatGPT Plus 订阅者可在 iOS 上获得 GPT-4 访问权限、早期功能和更快的响应速度。
OpenAI Blog
OpenAI 发布 ChatGPT Go,这是一项全新的全球订阅方案,每月 8 美元,提供比免费版多 10 倍的消息量和功能,同时保持 GPT-5.2 Instant 的访问权限。该产品旨在与现有的 Plus(每月 20 美元)和 Pro(每月 200 美元)计划一起,进一步扩大 AI 的普及范围。
OpenAI Blog
OpenAI 正向 ChatGPT Plus 和企业用户推出新的语音和图像功能,使用户能够进行语音对话并分享图像,实现由 GPT-3.5/GPT-4 和自定义文本转语音模型支持的多模态交互。
OpenAI Blog
OpenAI 推出 ChatGPT Team,这是一个新的订阅层级(每个用户每月 $25-30),专为团队协作设计,支持自定义 GPTs 和访问 GPT Store。该产品使团队能够创建和部署自定义 AI 工具,无需编码,可用于项目管理、代码生成和数据分析等任务。
OpenAI Blog
OpenAI 推出 ChatGPT Pro,这是一个月费 $200 的订阅计划,提供对包括 o1、o1-mini、GPT-4o 和高级语音等先进模型的无限制访问,以及用于计算密集型推理任务的 o1 pro 模式。