beautyyuyanli/multilingual-e5-large

Replicate Explore 模型

摘要

多语言 E5-large 嵌入模型现已上线 Replicate,单次运行约 0.00098 美元,在 Nvidia L40S 上约 1 秒完成。

beautyyuyanli / multilingual-e5-large
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/23 13:44

# beautyyuyanli/multilingual-e5-large – Replicate 来源:https://replicate.com/beautyyuyanli/multilingual-e5-large ## 运行时间与费用 在 Replicate 上运行该模型约需 $0.00098,即 1 美元可跑 1020 次,具体费用视输入而定。模型完全开源,你也可以用 Docker 在本地运行(https://replicate.com/beautyyuyanli/multilingual-e5-large/api)。 该模型在 Nvidia L40S GPU 硬件上运行(https://replicate.com/docs/billing)。单次预测通常在 1 秒内完成。

相似文章

krthr/clip-embeddings

Replicate Explore

一个托管在 Replicate 上的基于 CLIP 的嵌入模型,使用 clip-vit-large-patch14 架构为图像和文本生成 768 维嵌入向量,每次运行费用约为 $0.00022。

使用合成数据构建快速多语言OCR模型

Hugging Face Blog

NVIDIA推出Nemotron OCR v2,一个使用合成数据生成技术构建的快速多语言OCR模型。该模型通过采用统一的基于FOTS的架构,在检测、识别和关系组件之间实现特征复用,在单个A100 GPU上达到34.7页/秒的性能。

新的嵌入模型和 API 更新

OpenAI Blog

OpenAI 发布了两个新的嵌入模型:text-embedding-3-small(比 ada-002 便宜 5 倍,MIRACL 性能提升 40% 以上)和 text-embedding-3-large(性能最佳,支持最多 3072 维度)。两个模型在标准基准上都展现出显著的性能提升,同时降低了成本。