DeepSeek 加入代币量竞争,Anthropic 继续主导支出(12分钟阅读)

TLDR AI 新闻

摘要

AI Gateway 的2026年5月数据显示,DeepSeek的代币份额飙升至17%,但支出极少,而 Anthropic 保持了65%的支出,表明路由策略注重成本且整体使用量在增长。

DeepSeek 在 AI Gateway 上的代币份额在一个月内从不到1%跃升至17%,而其支出份额仍维持在接近1%的水平。
查看原文
查看缓存全文

缓存时间: 2026/06/11 00:12

DeepSeek 在 AI Gateway 上的 Token 份额从不到 1% 一个月内跃升至 17%,而其支出份额仍保持在 1% 左右。


DeepSeek 加入 Token 流量争夺战,Anthropic 继续主导支出

每个月,AI Gateway 在生产应用与 AI 实验室之间路由数十万亿个 Token,让我们得以摆脱排行榜和基准测试,看清 AI 使用的真实面貌。

2026 年 5 月生产指数摘要

  • AI Gateway 总 Token 量环比增长 +20%;总支出环比增长 +43%。客户平均为每个 Token 支付的费用比 4 月高出近 20%。

  • DeepSeek 的 Token 份额在一个月内从不到 1% 跃升至 17%,而其支出份额仍接近 1%。

  • Anthropic 的支出份额在 5 月从 61% 增长到 65%,并在每个高风险用例(AI 应用生成、后台 Agent 和编码 Agent)中占据 70–80% 的支出。

  • 成本意识带来了更智能的低成本与前沿模型路由。客户在哪个模型做哪项工作上更加精打细算,同时整体使用量仍在攀升。

上个月,关于 Token 预算超支的新闻占据了科技头条:Uber 在 Q1 后不久就烧光了年度 Claude Code 预算;Amazon 关闭了 KiroRank 以减少低效的 Token 滥用。虽然成本失控是个真实问题,但本月报告显示,生产用例上的支出仍在增长。

从 AI Gateway 5 月的数据中,我们得到了两点洞察:

  • 低成本模型进入生产: 新上线的模型定价使得已有实验室显得更加昂贵,而且这些模型能力足够,能够进入生产组合。

  • 支出在增长,但模型组合更智能: 团队仍在增加 Token 预算,但正在实施更智能的路由策略,让每一分钱都发挥更大价值。

低成本模型首次获得显著生产流量

从 2 月到 4 月,AI Gateway 上各实验室的流量分布变化缓慢,但 5 月 DeepSeek V4 的发布彻底改变了 Token 份额。4 月几乎不存在的低成本端市场,在 5 月成为 AI Gateway 按流量计的第三大供应商,而对整体支出影响甚微。

4 月,DeepSeek 占 AI Gateway 的 Token 量不到 1%,支出不到 0.2%。5 月,其流量份额跃升至 17% 的 Token,位列第三,超过了 OpenAI。几乎所有流量都来自两个模型:deepseek/deepseek-v4-flashdeepseek/deepseek-v4-pro,均于 5 月发布。

2026 年 5 月,DeepSeek 占据了月度 Token 的 17%,在网关上按 Token 量排名第三。

2026 年 5 月,DeepSeek 占据了月度 Token 的 17%,在网关上按 Token 量排名第三。

支出情况则讲述了另一半故事。尽管 DeepSeek 的 Token 份额一个月内增长到 17%,其成本份额仍接近 1%。

DeepSeek V4 Flash 发布时定价为每百万 Token 输入 $0.14 / 输出 $0.28,大约比同类 Anthropic 模型低 20–50 倍,比其他性价比旗舰模型如 Qwen 3.6 Plus 和 Kimi K2.6 低 8–12 倍。如此巨大的成本差距,使得团队迅速采用了 V4 Flash。

DeepSeek 在之前的 Token 流量图表中很突出,但在这张支出图表中几乎不可见。

DeepSeek 在之前的 Token 流量图表中很突出,但在这张支出图表中几乎不可见。

仅凭价格并不足以在一个月内让 DeepSeek 的流量发生如此大的变化,这意味着测试 DeepSeek V4 的团队将其与现有评估对比后,发现输出质量足以投入生产,而不仅仅是低成本值得一试。

性价比模型在 AI Gateway 上一直存在,但从未达到如此规模的份额,这意味着 DeepSeek V4 是第一款在其价格点上通过了生产工作质量门槛的模型。

前沿实验室继续占据新支出的大部分

尽管低成本端市场在流量上增长最快,但昂贵端在美元上的增长更快。

Anthropic 的 Token 份额从 26% 增长到 32%,支出份额从 61% 增长到 65%。OpenAI 的 Token 份额保持在 13% 左右,但支出份额从 12% 微升至 13%(基于更大的总量),因此客户在 5 月为每个 OpenAI Token 支付了更多。

5 月平均每个 Token 的价格变得更高,即使有 DeepSeek 拉低了平均值。价格上涨的原因是,需要前沿模型的工作增长速度快于不需要的工作。AI 编码 Agent 用例最清晰地展示了低成本/前沿的分化:

  • DeepSeek 驱动了该细分市场 49% 的 Token 流量,但仅占 4% 的成本。

  • Anthropic 驱动了 28% 的 Token 和 70% 的成本。

低成本模型现在已成为生产工作流的重要组成部分,但前沿模型的使用仍在增长,推动整体支出上升。

2026 年 4 月,xAI 和 MiniMax 在编码 Agent 用例中驱动了显著的 Token 流量。

2026 年 4 月,xAI 和 MiniMax 在编码 Agent 用例中驱动了显著的 Token 流量。

2026 年 5 月,DeepSeek 占据了编码 Agent 用例近一半的份额,xAI 和 MiniMax 大幅下降。后台工作负载在这两个月都保持以 Anthropic 为主。

2026 年 5 月,DeepSeek 占据了编码 Agent 用例近一半的份额,xAI 和 MiniMax 大幅下降。后台工作负载在这两个月都保持以 Anthropic 为主。

前沿模型每个 Token 的价格越来越贵,而客户仍在付费。Anthropic 继续主导支出,5 月占据了网关总支出的 65%,并在每个高风险用例中占据 70–80% 的支出。

2026 年 4 月,Anthropic 是高风险用例(如 AI 应用生成、后台 Agent 和 AI 编码 Agent)的首选前沿实验室。

2026 年 4 月,Anthropic 是高风险用例(如 AI 应用生成、后台 Agent 和 AI 编码 Agent)的首选前沿实验室。

即使 DeepSeek V4 在 Token 流量上大幅增长,Anthropic 在 2026 年 5 月仍继续主导高风险用例。

即使 DeepSeek V4 在 Token 流量上大幅增长,Anthropic 在 2026 年 5 月仍继续主导高风险用例。

成本纪律成为路由策略

整体支出的增长表明 5 月份对 AI 的需求仍在增长,但团队通过路由将预算运用得更加精准。他们将廉价、高流量的工作发送给低价模型,而在质量最重要的地方使用前沿模型。Google 最新 Flash 模型的缓慢采用就是一个明显的例子。

Gemini 3.5 Flash 于 5 月发布,定价高于 Gemini 3.0 Flash,但大规模迁移并未发生。到月底,3.5 仅占 Flash 系列 Token 的 7%,而 3.0 Flash 占据了 90%。

当 Gemini 3.5 Flash 于 5 月以高于 Gemini 3 的价格发布时,大规模迁移并未发生。

当 Gemini 3.5 Flash 于 5 月以高于 Gemini 3 的价格发布时,大规模迁移并未发生。

与 2 月和 3 月对 Gemini 3.1 Pro 的快速采用相比,对 3.5 Flash 的迁移缓慢表明,对 3.0 Flash 满意的团队还不太愿意为更高的成本买单。

当 Gemini 3.1 Pro 于 2 月发布时,它立即获得了 30% 的采用率,次月便成为该系列的主导模型。

当 Gemini 3.1 Pro 于 2 月发布时,它立即获得了 30% 的采用率,次月便成为该系列的主导模型。

结论:经济实惠且能力够用的选择意味着更智能的模型组合

本月的报告表明,尽管整体支出和 Token 流量在增长,但市场的价格敏感度正在提高。这意味着开发者正在寻找让每一分钱产出更多价值的方法。

数据揭示了两种优化策略:

  • 使用 DeepSeek 廉价但能力充足的 V4 系列处理低风险、高流量任务

  • 选择推迟模型系列升级,直到 ROI 合理

路由使得团队能够根据实验室在不同层次生产 AI 工作负载上的竞争,实时调整模型组合和预算。

您可以在 Vercel Blog 上阅读完整报告。

相似文章

AI Gateway 生产趋势(阅读时间8分钟)

TLDR AI

Vercel 的 AI Gateway 数据显示,Anthropic 在支出方面领先,Google 在 Token 量方面领先,而代理型工作负载占 Token 总量的 59%。OpenAI 的支出份额在最近的模型更新后增长了近两倍。

)

TLDR AI

DeepSeek 永久将 V4 Pro 价格降低 75%,低于 OpenAI、Anthropic 和 Google 的领先 AI 模型,加剧了 AI 价格战。