新的嵌入模型和 API 更新

OpenAI Blog 2024/01/25 08:00 模型

embedding-models api-update text-embedding-3 performance-improvement pricing-reduction openai

摘要

OpenAI 发布了两个新的嵌入模型：text-embedding-3-small（比 ada-002 便宜 5 倍，MIRACL 性能提升 40% 以上）和 text-embedding-3-large（性能最佳，支持最多 3072 维度）。两个模型在标准基准上都展现出显著的性能提升，同时降低了成本。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:54

# 新的嵌入模型和 API 更新源：https://openai.com/index/new-embedding-models-and-api-updates/ `text-embedding-3-small` 是我们新推出的高效嵌入模型，相比其前身 `text-embedding-ada-002` 模型（发布于 2022 年 12 月（https://openai.com/index/new-and-improved-embedding-model/））有了显著提升。 **性能更强。**对比 `text-embedding-ada-002` 和 `text-embedding-3-small`，在多语言检索的常用基准测试（MIRACL（在新窗口中打开）(https://github.com/project-miracl/miracl)）上的平均得分从 31.4% 提高到了 44.0%，而在英文任务的常用基准测试（MTEB（在新窗口中打开）(https://github.com/embeddings-benchmark/mteb)）上的平均得分从 61.0% 提高到了 62.3%。 **价格更低。**`text-embedding-3-small` 的效率也大幅高于上一代的 `text-embedding-ada-002` 模型。因此，`text-embedding-3-small` 的价格相比 `text-embedding-ada-002` 下降了 5 倍，从每 1k 个 token $0.0001 降至 $0.00002。我们不会弃用 `text-embedding-ada-002`，所以虽然我们推荐使用新模型，但客户可以继续使用上一代模型。 ## 新的大型文本嵌入模型：`text-embedding-3-large` `text-embedding-3-large` 是我们新推出的下一代更大型嵌入模型，可创建最多 3072 维的嵌入。 **性能更强。**`text-embedding-3-large` 是我们性能最好的模型。对比 `text-embedding-ada-002` 和 `text-embedding-3-large`：在 MIRACL 上，平均得分从 31.4% 提高到了 54.9%，而在 MTEB 上，平均得分从 61.0% 提高到了 64.6%。

新的嵌入模型和 API 更新

相似文章

全新改进的嵌入模型

介绍文本和代码嵌入

@liquidai: 介绍 LFM2.5-Embedding-350M 和 LFM2.5-ColBERT-350M：两款为超快且精准的多语言检索模型

LiquidAI/LFM2.5-Embedding-350M

对 Google Embeddings 2 与开源模型在多语言稠密检索和 RAG 系统中的基准测试

提交意见反馈