DeepSeek 加入代币量竞争,Anthropic 继续主导支出(12分钟阅读)
摘要
AI Gateway 的2026年5月数据显示,DeepSeek的代币份额飙升至17%,但支出极少,而 Anthropic 保持了65%的支出,表明路由策略注重成本且整体使用量在增长。
查看缓存全文
缓存时间: 2026/06/11 00:12
DeepSeek 在 AI Gateway 上的 Token 份额从不到 1% 一个月内跃升至 17%,而其支出份额仍保持在 1% 左右。
DeepSeek 加入 Token 流量争夺战,Anthropic 继续主导支出
每个月,AI Gateway 在生产应用与 AI 实验室之间路由数十万亿个 Token,让我们得以摆脱排行榜和基准测试,看清 AI 使用的真实面貌。
2026 年 5 月生产指数摘要
-
AI Gateway 总 Token 量环比增长 +20%;总支出环比增长 +43%。客户平均为每个 Token 支付的费用比 4 月高出近 20%。
-
DeepSeek 的 Token 份额在一个月内从不到 1% 跃升至 17%,而其支出份额仍接近 1%。
-
Anthropic 的支出份额在 5 月从 61% 增长到 65%,并在每个高风险用例(AI 应用生成、后台 Agent 和编码 Agent)中占据 70–80% 的支出。
-
成本意识带来了更智能的低成本与前沿模型路由。客户在哪个模型做哪项工作上更加精打细算,同时整体使用量仍在攀升。
上个月,关于 Token 预算超支的新闻占据了科技头条:Uber 在 Q1 后不久就烧光了年度 Claude Code 预算;Amazon 关闭了 KiroRank 以减少低效的 Token 滥用。虽然成本失控是个真实问题,但本月报告显示,生产用例上的支出仍在增长。
从 AI Gateway 5 月的数据中,我们得到了两点洞察:
-
低成本模型进入生产: 新上线的模型定价使得已有实验室显得更加昂贵,而且这些模型能力足够,能够进入生产组合。
-
支出在增长,但模型组合更智能: 团队仍在增加 Token 预算,但正在实施更智能的路由策略,让每一分钱都发挥更大价值。
低成本模型首次获得显著生产流量
从 2 月到 4 月,AI Gateway 上各实验室的流量分布变化缓慢,但 5 月 DeepSeek V4 的发布彻底改变了 Token 份额。4 月几乎不存在的低成本端市场,在 5 月成为 AI Gateway 按流量计的第三大供应商,而对整体支出影响甚微。
4 月,DeepSeek 占 AI Gateway 的 Token 量不到 1%,支出不到 0.2%。5 月,其流量份额跃升至 17% 的 Token,位列第三,超过了 OpenAI。几乎所有流量都来自两个模型:deepseek/deepseek-v4-flash 和 deepseek/deepseek-v4-pro,均于 5 月发布。
2026 年 5 月,DeepSeek 占据了月度 Token 的 17%,在网关上按 Token 量排名第三。
2026 年 5 月,DeepSeek 占据了月度 Token 的 17%,在网关上按 Token 量排名第三。
支出情况则讲述了另一半故事。尽管 DeepSeek 的 Token 份额一个月内增长到 17%,其成本份额仍接近 1%。
DeepSeek V4 Flash 发布时定价为每百万 Token 输入 $0.14 / 输出 $0.28,大约比同类 Anthropic 模型低 20–50 倍,比其他性价比旗舰模型如 Qwen 3.6 Plus 和 Kimi K2.6 低 8–12 倍。如此巨大的成本差距,使得团队迅速采用了 V4 Flash。
DeepSeek 在之前的 Token 流量图表中很突出,但在这张支出图表中几乎不可见。
DeepSeek 在之前的 Token 流量图表中很突出,但在这张支出图表中几乎不可见。
仅凭价格并不足以在一个月内让 DeepSeek 的流量发生如此大的变化,这意味着测试 DeepSeek V4 的团队将其与现有评估对比后,发现输出质量足以投入生产,而不仅仅是低成本值得一试。
性价比模型在 AI Gateway 上一直存在,但从未达到如此规模的份额,这意味着 DeepSeek V4 是第一款在其价格点上通过了生产工作质量门槛的模型。
前沿实验室继续占据新支出的大部分
尽管低成本端市场在流量上增长最快,但昂贵端在美元上的增长更快。
Anthropic 的 Token 份额从 26% 增长到 32%,支出份额从 61% 增长到 65%。OpenAI 的 Token 份额保持在 13% 左右,但支出份额从 12% 微升至 13%(基于更大的总量),因此客户在 5 月为每个 OpenAI Token 支付了更多。
5 月平均每个 Token 的价格变得更高,即使有 DeepSeek 拉低了平均值。价格上涨的原因是,需要前沿模型的工作增长速度快于不需要的工作。AI 编码 Agent 用例最清晰地展示了低成本/前沿的分化:
-
DeepSeek 驱动了该细分市场 49% 的 Token 流量,但仅占 4% 的成本。
-
Anthropic 驱动了 28% 的 Token 和 70% 的成本。
低成本模型现在已成为生产工作流的重要组成部分,但前沿模型的使用仍在增长,推动整体支出上升。
2026 年 4 月,xAI 和 MiniMax 在编码 Agent 用例中驱动了显著的 Token 流量。
2026 年 4 月,xAI 和 MiniMax 在编码 Agent 用例中驱动了显著的 Token 流量。
2026 年 5 月,DeepSeek 占据了编码 Agent 用例近一半的份额,xAI 和 MiniMax 大幅下降。后台工作负载在这两个月都保持以 Anthropic 为主。
2026 年 5 月,DeepSeek 占据了编码 Agent 用例近一半的份额,xAI 和 MiniMax 大幅下降。后台工作负载在这两个月都保持以 Anthropic 为主。
前沿模型每个 Token 的价格越来越贵,而客户仍在付费。Anthropic 继续主导支出,5 月占据了网关总支出的 65%,并在每个高风险用例中占据 70–80% 的支出。
2026 年 4 月,Anthropic 是高风险用例(如 AI 应用生成、后台 Agent 和 AI 编码 Agent)的首选前沿实验室。
2026 年 4 月,Anthropic 是高风险用例(如 AI 应用生成、后台 Agent 和 AI 编码 Agent)的首选前沿实验室。
即使 DeepSeek V4 在 Token 流量上大幅增长,Anthropic 在 2026 年 5 月仍继续主导高风险用例。
即使 DeepSeek V4 在 Token 流量上大幅增长,Anthropic 在 2026 年 5 月仍继续主导高风险用例。
成本纪律成为路由策略
整体支出的增长表明 5 月份对 AI 的需求仍在增长,但团队通过路由将预算运用得更加精准。他们将廉价、高流量的工作发送给低价模型,而在质量最重要的地方使用前沿模型。Google 最新 Flash 模型的缓慢采用就是一个明显的例子。
Gemini 3.5 Flash 于 5 月发布,定价高于 Gemini 3.0 Flash,但大规模迁移并未发生。到月底,3.5 仅占 Flash 系列 Token 的 7%,而 3.0 Flash 占据了 90%。
当 Gemini 3.5 Flash 于 5 月以高于 Gemini 3 的价格发布时,大规模迁移并未发生。
当 Gemini 3.5 Flash 于 5 月以高于 Gemini 3 的价格发布时,大规模迁移并未发生。
与 2 月和 3 月对 Gemini 3.1 Pro 的快速采用相比,对 3.5 Flash 的迁移缓慢表明,对 3.0 Flash 满意的团队还不太愿意为更高的成本买单。
当 Gemini 3.1 Pro 于 2 月发布时,它立即获得了 30% 的采用率,次月便成为该系列的主导模型。
当 Gemini 3.1 Pro 于 2 月发布时,它立即获得了 30% 的采用率,次月便成为该系列的主导模型。
结论:经济实惠且能力够用的选择意味着更智能的模型组合
本月的报告表明,尽管整体支出和 Token 流量在增长,但市场的价格敏感度正在提高。这意味着开发者正在寻找让每一分钱产出更多价值的方法。
数据揭示了两种优化策略:
-
使用 DeepSeek 廉价但能力充足的 V4 系列处理低风险、高流量任务
-
选择推迟模型系列升级,直到 ROI 合理
路由使得团队能够根据实验室在不同层次生产 AI 工作负载上的竞争,实时调整模型组合和预算。
您可以在 Vercel Blog 上阅读完整报告。
相似文章
AI Gateway 生产趋势(阅读时间8分钟)
Vercel 的 AI Gateway 数据显示,Anthropic 在支出方面领先,Google 在 Token 量方面领先,而代理型工作负载占 Token 总量的 59%。OpenAI 的支出份额在最近的模型更新后增长了近两倍。
)
DeepSeek 永久将 V4 Pro 价格降低 75%,低于 OpenAI、Anthropic 和 Google 的领先 AI 模型,加剧了 AI 价格战。
@mark_k: 关于DeepSeek AI(@deepseek_ai)的一篇引人入胜且非常深刻的分析文章。你绝对猜不到他们的策略是什么……
对DeepSeek AI非常规策略的分析:优先采用激进架构创新(MoE、MLA、engram、mHC),大幅降低计算和内存需求,从而实现长期布局,构建一个10万亿人民币的中国AI硬件生态系统,并追求1万亿美元估值。
Anthropic 正在租用 Elon 的 GPU 进行推理。代币短缺刚刚开始。
Anthropic 正在从 xAI 的 Colossus 集群租用 GPU 进行推理,因为代币消耗呈指数级增长,这凸显了代币短缺问题,推高了成本并给 AI 公司的利润率带来压力。
DeepSeek 宣布促销期后将永久降价75%
DeepSeek 宣布在促销期结束后将永久降价75%,使其AI服务对用户来说价格大幅降低。