为微调 API 引入视觉功能

OpenAI Blog 2024/10/01 10:04 产品

摘要

OpenAI 为 GPT-4o 推出视觉微调功能，允许开发者使用图像数据和文本对模型进行定制，以在视觉搜索、物体检测和医学影像分析等视觉任务中提升性能。

开发者现在可以使用图像和文本对 GPT-4o 进行微调，以改进视觉能力

查看缓存全文

缓存时间: 2026/04/20 14:47

# 向微调 API 引入视觉能力来源：https://openai.com/index/introducing-vision-to-the-fine-tuning-api/ 今天，我们推出了 GPT-4o 的视觉微调功能，使开发者能够使用图像进行微调，而不仅仅是文本。开发者可以自定义模型，使其具有更强的图像理解能力，从而实现增强的视觉搜索功能、改进自动驾驶车或智慧城市的物体检测，以及更精准的医学影像分析等应用。自从我们首次推出 GPT-4o 的微调功能以来，已有数十万开发者使用纯文本数据集自定义我们的模型，以改进特定任务的性能。然而，在许多情况下，仅使用文本对模型进行微调无法提供预期的性能提升。

为微调 API 引入视觉功能

相似文章

GPT-4o 现已支持微调

GPT-3.5 Turbo 微调和 API 更新

微调 API 功能改进和自定义模型项目扩展

GPT-4o 微调网络研讨会

GPT-4V(ision) 系统卡

提交意见反馈