GPT-3.5 Turbo 微调和 API 更新
摘要
OpenAI 推出了 GPT-3.5 Turbo 的微调功能,允许开发者为特定用例定制模型,以获得更好的性能、可控性和输出格式。该更新使得经过微调的 GPT-3.5 Turbo 能够在某些任务上匹配 GPT-4 的性能,同时可将提示词大小减少 90%。
开发者现在可以使用自己的数据来定制 GPT-3.5 Turbo 以满足他们的特定需求。
查看缓存全文
缓存时间:
2026/04/20 14:54
# GPT-3.5 Turbo 微调和 API 更新
来源:https://openai.com/index/gpt-3-5-turbo-fine-tuning-and-api-updates/
GPT-3.5 Turbo 微调现已推出,GPT-4 微调将在今年秋季推出。此次更新使开发者能够自定义模型,以更好地适应他们的用例,并大规模运行这些自定义模型。早期测试表明,经过微调的 GPT-3.5 Turbo 版本在某些特定任务上可以匹配甚至超越基础 GPT-4 级别的能力。与我们所有 API 一样,通过微调 API 发送进出的数据由客户拥有,不会被 OpenAI (https://openai.com/api-data-privacy/) 或任何其他组织用于训练其他模型。
自 GPT-3.5 Turbo 发布以来,开发者和企业一直要求能够自定义模型,以为用户创造独特且有差异化的体验。通过此次发布,开发者现在可以进行有监督的微调,使该模型在其用例上表现得更好。
在我们的私密测试中,微调客户已经能够在常见用例中有意义地改进模型性能,例如:
- **改进的可控性**:微调使企业能够让模型更好地遵循指令,例如使输出简洁或始终以给定语言响应。例如,开发者可以使用微调确保模型在提示使用该语言时始终用德语响应。
- **可靠的输出格式**:微调改进了模型一致格式化响应的能力——这对需要特定响应格式的应用至关重要,例如代码补全或 API 调用编写。开发者可以使用微调更可靠地将用户提示转换为高质量的 JSON 代码片段,以便与自己的系统一起使用。
- **自定义语气**:微调是微调模型输出定性感觉(如语气)的绝佳方式,使其更好地符合企业品牌的声音。具有可识别品牌声音的企业可以使用微调使模型与其语气更加一致。
除了性能提升外,微调还使企业能够**缩短提示**,同时确保类似的性能。使用 GPT-3.5 Turbo 进行微调也可以处理 4k 令牌——是我们之前微调模型的两倍。早期测试者通过将指令微调到模型本身中,减少了高达 90% 的提示大小,加快了每个 API 调用速度并降低了成本。
微调与其他技术 (https://platform.openai.com/docs/guides/gpt-best-practices)(例如提示工程、信息检索和函数调用)结合时最为强大。查看我们的微调指南 (https://platform.openai.com/docs/guides/fine-tuning)了解更多信息。对函数调用和 `gpt-3.5-turbo-16k` 的微调支持将在今年秋季晚些时候推出。
相似文章
OpenAI Blog
# 为您的应用自定义 GPT-3 来源:[https://openai.com/index/customizing-gpt-3/](https://openai.com/index/customizing-gpt-3/) OpenAI使用单条命令进行微调。开发者现在可以在自己的数据上对 GPT-3 进行微调,创建针对其应用定制的版本。自定义使 GPT-3 能够可靠地支持更广泛的用例,并使模型运行更便宜、更快。您可以使用任何形状和大小的现有数据集,或逐步添加数据
OpenAI Blog
OpenAI 推出了 GPT-4o 和 GPT-4o mini 的微调功能,允许开发者使用自己的数据集以更低成本自定义模型。该功能包括免费的训练代币(GPT-4o 每天 1M,GPT-4o mini 每天 2M,有效期至 9 月 23 日),面向所有付费层级的开发者提供。
OpenAI Blog
OpenAI 通过 API 推出 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 模型,在编程(SWE-bench 得分达 54.6%)、指令遵循和 100 万 token 上下文窗口方面有重大改进,成本更低。GPT-4.5 Preview 将于 2025 年 7 月 14 日停用。
OpenAI Blog
OpenAI 宣布 GPT-4 API 正式上线,并将停用旧的完成模型(GPT-3 基础模型和 text-davinci-003),要求开发者在 2024 年 1 月 4 日前迁移至 gpt-3.5-turbo-instruct 或更新的模型。微调模型需要在新的基础模型上重新训练,并为 GPT-3.5 Turbo 和 GPT-4 微调提供优先级访问权限。
OpenAI Blog
OpenAI发布了GPT-5.1,这是GPT-5系列中的一个新模型,它可以基于任务复杂度动态调整思考时间,在保持前沿智能的同时,性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存(24小时保留)、新的编码工具(apply_patch和shell),以及针对延迟敏感应用的“无推理”模式。