krthr/clip-embeddings

Replicate Explore 工具

clip embeddings image-embeddings text-embeddings replicate open-source vision-language

摘要

一个托管在 Replicate 上的基于 CLIP 的嵌入模型，使用 clip-vit-large-patch14 架构为图像和文本生成 768 维嵌入向量，每次运行费用约为 $0.00022。

krthr / clip-embeddings

查看缓存全文

缓存时间: 2026/05/09 06:25

# 在 Replicate 上使用 CLIP 进行图像和文本嵌入来源：https://replicate.com/krthr/clip-embeddings ## 运行时间与费用该模型在 Replicate 上每次运行费用约为 $0.00022，即每 $1 可运行 4545 次，但具体费用会因输入内容而有所不同。该模型同时也是开源的，你可以[使用 Docker 在自己的电脑上运行它](https://replicate.com/krthr/clip-embeddings/api)。该模型运行在 [Nvidia T4 GPU 硬件](https://replicate.com/docs/billing)上。预测通常在 1 秒内完成。 ## 说明使用 CLIP 获取文本和图像嵌入向量。 ### 详细信息 - 使用的模型：`clip-vit-large-patch14` - 嵌入向量长度：`768` ### 响应格式 ``` { "embedding": [0.1, 0.2, ..., 0.5] } ``` 模型创建于 1 年前

krthr/clip-embeddings

相似文章

andreasjansson/clip-features

beautyyuyanli/multilingual-e5-large

CLIP：连接文本与图像

使用CLIP潜在表示的分层文本条件图像生成

新的嵌入模型和 API 更新

提交意见反馈