DeepInfra 正式加入 Hugging Face Inference Providers 🔥
摘要
DeepInfra 已作为官方推理提供商加入 Hugging Face Hub,用户现在可以直接通过 HF 界面和 SDK 对 DeepSeek V4、Kimi-K2.6 等模型进行无服务器推理。
查看缓存全文
缓存时间: 2026/05/08 09:00
DeepInfra 正式加入 Hugging Face Inference Providers 🔥
来源:https://huggingface.co/blog/inference-providers-deepinfra 返回文章列表 (https://huggingface.co/blog)
我们很高兴地宣布,DeepInfra 现已正式成为 Hugging Face Hub 支持的 Inference Provider!
DeepInfra 加入了我们不断壮大的生态系统,进一步扩展了 Hub 模型页面上 serverless inference 的覆盖范围和功能。Inference Providers 也已无缝集成到我们的客户端 SDK 中(支持 JS 和 Python),让你可以轻松使用各类模型,并自由选择偏好的 provider。
DeepInfra 是一个 serverless AI 推理平台,提供业内极具竞争力的 token 单价。其模型目录涵盖超过 100 个模型,让开发者能够以极低的配置成本,快速将各类 AI 能力集成到应用中。
DeepInfra 支持多种模型类型——从 LLM 到文生图、文生视频、Embedding 等。作为首次集成,DeepInfra 在 Hugging Face 上率先支持对话和文本生成任务,可访问包括 DeepSeek V4、Kimi-K2.6、GLM-5.1 等在内的热门开源权重 LLM。更多任务类型(文生图、文生视频、Embedding 等)的支持即将推出!
了解更多关于如何在 Hugging Face 上使用 DeepInfra 作为 Inference Provider 的信息,请查阅其专属文档页面。
查看 DeepInfra 支持的完整模型列表,请点击此处。
在 Hugging Face 上关注 DeepInfra:https://huggingface.co/DeepInfra
工作原理
在网站 UI 中
- 在用户账户设置中,你可以:
- 为已注册的 provider 设置自己的 API key。如果未设置自定义 key,你的请求将通过 HF 路由。
- 按偏好排序 provider。这将影响模型页面上的 widget 和代码片段。
Inference Providers
- 如前所述,调用 Inference Providers 时有两种模式:
- 自定义 key(请求直接发送给 inference provider,使用对应 provider 的自有 API key)
- HF 路由(无需 provider 的 token,费用直接从你的 HF 账户扣除,而非 provider 账户)
Inference Providers
- 模型页面会展示第三方 inference provider(显示与当前模型兼容的 provider,按用户偏好排序)
Inference Providers
通过客户端 SDKs
DeepInfra 可通过 Hugging Face SDK 使用——Python 使用 huggingface_hub(>= 1.11.2),JavaScript 使用 @huggingface/inference。
以下示例展示如何通过 DeepInfra 使用 DeepSeek V4 Pro。使用 Hugging Face token 进行认证——请求将自动路由至 DeepInfra。
从你最爱的 Agent Harness
Hugging Face Inference Providers 已集成到大多数 Agent Harness 中——包括 Pi、OpenCode、Hermes Agents、OpenClaw 等。这意味着你可以直接将 DeepInfra 托管的模型接入常用工具,无需额外的胶水代码。浏览完整的集成列表,请点击此处。
Python
import os
from openai import OpenAI
client = OpenAI(
base_url="https://router.huggingface.co/v1",
api_key=os.environ["HF_TOKEN"],
)
completion = client.chat.completions.create(
model="deepseek-ai/DeepSeek-V4-Pro:deepinfra",
messages=[
{
"role": "user",
"content": "Write a Python function that returns the nth Fibonacci number using memoization."
}
],
)
print(completion.choices[0].message)
JS
import { OpenAI } from "openai";
const client = new OpenAI({
baseURL: "https://router.huggingface.co/v1",
apiKey: process.env.HF_TOKEN,
});
const chatCompletion = await client.chat.completions.create({
model: "deepseek-ai/DeepSeek-V4-Pro:deepinfra",
messages: [
{
role: "user",
content: "Write a Python function that returns the nth Fibonacci number using memoization.",
},
],
});
console.log(chatCompletion.choices[0].message);
计费说明
对于直接请求,即使用 inference provider 的 key 时,由对应的 provider 计费。例如,使用 DeepInfra API key 时,费用计入你的 DeepInfra 账户。
对于路由请求,即通过 Hugging Face Hub 认证时,你只需支付标准的 provider API 费率。我们不收取额外加价,仅直接传递 provider 的成本。(未来,我们可能会与 provider 合作伙伴建立收入分成协议。)
重要提示!PRO 用户每月可获得价值 $2 的 Inference 额度,可在各 provider 间通用。🔥
订阅 Hugging Face PRO 计划,即可获得 Inference 额度、ZeroGPU、Spaces Dev Mode、20 倍更高限额等权益。
我们也为登录的免费用户提供少量免费推理额度,但如条件允许,欢迎升级至 PRO!
反馈与后续计划
我们期待听到你的反馈!在此分享你的想法和/或评论:https://huggingface.co/spaces/huggingface/HuggingDiscussions/discussions/49
相似文章
@k1rallik:NVIDIA 真的在免费送 AI 推理!我 5 分钟搞定,完全不敢相信是免费的 D…
NVIDIA 通过 DGX Cloud 提供免费的 AI 推理,支持 DeepSeek、MiniMax、Kimi、GLM、Llama 等热门模型,API 兼容 OpenAI,5 分钟即可领取。
@DJLougen:这是一个巨大的承诺,一如既往地感谢@huggingface及其团队对本地机会的承诺
GLM-5.2现在可在接下来的6小时内通过Hugging Face Inference Providers免费使用,支持开源AI。
Deepseek, Kimi 等
提及 AI 模型 Deepseek 和 Kimi,可能讨论最近的更新或比较。
我在家运行了(更快的)DeepSeek V4 Pro
用户报告成功使用 ktransformers 在本地运行 DeepSeek V4 Pro 模型,并分享了在不同上下文深度下的详细基准测试结果,展示了改进的推理速度。
@ClementDelangue:Hugging Face 正成为代理使用和构建 AI 的平台,现在它们可以调用 100 万个 HF Spaces,完成最新专用模型所能做的一切……
Hugging Face 现允许 AI 代理调用 100 万个 Spaces,把 Hub 变成可编程平台,代理可随手调用任何专用模型或应用。