DeepSeek 加入代币量竞争，Anthropic 继续主导支出（12分钟阅读）

TLDR AI 2026/06/10 00:00 新闻

ai-gateway token-volume cost-efficiency production-ai anthropic deepseek model-mix

摘要

AI Gateway 的2026年5月数据显示，DeepSeek的代币份额飙升至17%，但支出极少，而 Anthropic 保持了65%的支出，表明路由策略注重成本且整体使用量在增长。

DeepSeek 在 AI Gateway 上的代币份额在一个月内从不到1%跃升至17%，而其支出份额仍维持在接近1%的水平。

查看原文

查看缓存全文

缓存时间: 2026/06/11 00:12

DeepSeek 在 AI Gateway 上的 Token 份额从不到 1% 一个月内跃升至 17%，而其支出份额仍保持在 1% 左右。

DeepSeek 加入 Token 流量争夺战，Anthropic 继续主导支出

每个月，AI Gateway 在生产应用与 AI 实验室之间路由数十万亿个 Token，让我们得以摆脱排行榜和基准测试，看清 AI 使用的真实面貌。

2026 年 5 月生产指数摘要

AI Gateway 总 Token 量环比增长 +20%；总支出环比增长 +43%。客户平均为每个 Token 支付的费用比 4 月高出近 20%。
DeepSeek 的 Token 份额在一个月内从不到 1% 跃升至 17%，而其支出份额仍接近 1%。
Anthropic 的支出份额在 5 月从 61% 增长到 65%，并在每个高风险用例（AI 应用生成、后台 Agent 和编码 Agent）中占据 70–80% 的支出。
成本意识带来了更智能的低成本与前沿模型路由。客户在哪个模型做哪项工作上更加精打细算，同时整体使用量仍在攀升。

上个月，关于 Token 预算超支的新闻占据了科技头条：Uber 在 Q1 后不久就烧光了年度 Claude Code 预算；Amazon 关闭了 KiroRank 以减少低效的 Token 滥用。虽然成本失控是个真实问题，但本月报告显示，生产用例上的支出仍在增长。

从 AI Gateway 5 月的数据中，我们得到了两点洞察：

低成本模型进入生产： 新上线的模型定价使得已有实验室显得更加昂贵，而且这些模型能力足够，能够进入生产组合。
支出在增长，但模型组合更智能： 团队仍在增加 Token 预算，但正在实施更智能的路由策略，让每一分钱都发挥更大价值。

低成本模型首次获得显著生产流量

从 2 月到 4 月，AI Gateway 上各实验室的流量分布变化缓慢，但 5 月 DeepSeek V4 的发布彻底改变了 Token 份额。4 月几乎不存在的低成本端市场，在 5 月成为 AI Gateway 按流量计的第三大供应商，而对整体支出影响甚微。

4 月，DeepSeek 占 AI Gateway 的 Token 量不到 1%，支出不到 0.2%。5 月，其流量份额跃升至 17% 的 Token，位列第三，超过了 OpenAI。几乎所有流量都来自两个模型：deepseek/deepseek-v4-flash 和 deepseek/deepseek-v4-pro，均于 5 月发布。

2026 年 5 月，DeepSeek 占据了月度 Token 的 17%，在网关上按 Token 量排名第三。

支出情况则讲述了另一半故事。尽管 DeepSeek 的 Token 份额一个月内增长到 17%，其成本份额仍接近 1%。

DeepSeek V4 Flash 发布时定价为每百万 Token 输入 $0.14 / 输出 $0.28，大约比同类 Anthropic 模型低 20–50 倍，比其他性价比旗舰模型如 Qwen 3.6 Plus 和 Kimi K2.6 低 8–12 倍。如此巨大的成本差距，使得团队迅速采用了 V4 Flash。

DeepSeek 在之前的 Token 流量图表中很突出，但在这张支出图表中几乎不可见。

仅凭价格并不足以在一个月内让 DeepSeek 的流量发生如此大的变化，这意味着测试 DeepSeek V4 的团队将其与现有评估对比后，发现输出质量足以投入生产，而不仅仅是低成本值得一试。

性价比模型在 AI Gateway 上一直存在，但从未达到如此规模的份额，这意味着 DeepSeek V4 是第一款在其价格点上通过了生产工作质量门槛的模型。

前沿实验室继续占据新支出的大部分

尽管低成本端市场在流量上增长最快，但昂贵端在美元上的增长更快。

Anthropic 的 Token 份额从 26% 增长到 32%，支出份额从 61% 增长到 65%。OpenAI 的 Token 份额保持在 13% 左右，但支出份额从 12% 微升至 13%（基于更大的总量），因此客户在 5 月为每个 OpenAI Token 支付了更多。

5 月平均每个 Token 的价格变得更高，即使有 DeepSeek 拉低了平均值。价格上涨的原因是，需要前沿模型的工作增长速度快于不需要的工作。AI 编码 Agent 用例最清晰地展示了低成本/前沿的分化：

DeepSeek 驱动了该细分市场 49% 的 Token 流量，但仅占 4% 的成本。
Anthropic 驱动了 28% 的 Token 和 70% 的成本。

低成本模型现在已成为生产工作流的重要组成部分，但前沿模型的使用仍在增长，推动整体支出上升。

2026 年 4 月，xAI 和 MiniMax 在编码 Agent 用例中驱动了显著的 Token 流量。

2026 年 5 月，DeepSeek 占据了编码 Agent 用例近一半的份额，xAI 和 MiniMax 大幅下降。后台工作负载在这两个月都保持以 Anthropic 为主。

前沿模型每个 Token 的价格越来越贵，而客户仍在付费。Anthropic 继续主导支出，5 月占据了网关总支出的 65%，并在每个高风险用例中占据 70–80% 的支出。

2026 年 4 月，Anthropic 是高风险用例（如 AI 应用生成、后台 Agent 和 AI 编码 Agent）的首选前沿实验室。

即使 DeepSeek V4 在 Token 流量上大幅增长，Anthropic 在 2026 年 5 月仍继续主导高风险用例。

成本纪律成为路由策略

整体支出的增长表明 5 月份对 AI 的需求仍在增长，但团队通过路由将预算运用得更加精准。他们将廉价、高流量的工作发送给低价模型，而在质量最重要的地方使用前沿模型。Google 最新 Flash 模型的缓慢采用就是一个明显的例子。

Gemini 3.5 Flash 于 5 月发布，定价高于 Gemini 3.0 Flash，但大规模迁移并未发生。到月底，3.5 仅占 Flash 系列 Token 的 7%，而 3.0 Flash 占据了 90%。

当 Gemini 3.5 Flash 于 5 月以高于 Gemini 3 的价格发布时，大规模迁移并未发生。

与 2 月和 3 月对 Gemini 3.1 Pro 的快速采用相比，对 3.5 Flash 的迁移缓慢表明，对 3.0 Flash 满意的团队还不太愿意为更高的成本买单。

当 Gemini 3.1 Pro 于 2 月发布时，它立即获得了 30% 的采用率，次月便成为该系列的主导模型。

结论：经济实惠且能力够用的选择意味着更智能的模型组合

本月的报告表明，尽管整体支出和 Token 流量在增长，但市场的价格敏感度正在提高。这意味着开发者正在寻找让每一分钱产出更多价值的方法。

数据揭示了两种优化策略：

使用 DeepSeek 廉价但能力充足的 V4 系列处理低风险、高流量任务
选择推迟模型系列升级，直到 ROI 合理

路由使得团队能够根据实验室在不同层次生产 AI 工作负载上的竞争，实时调整模型组合和预算。

您可以在 Vercel Blog 上阅读完整报告。

DeepSeek 加入代币量竞争，Anthropic 继续主导支出（12分钟阅读）

DeepSeek 加入 Token 流量争夺战，Anthropic 继续主导支出

低成本模型首次获得显著生产流量

前沿实验室继续占据新支出的大部分

成本纪律成为路由策略

结论：经济实惠且能力够用的选择意味着更智能的模型组合

相似文章

AI Gateway 生产趋势（阅读时间8分钟）

)

@mark_k: 关于DeepSeek AI（@deepseek_ai）的一篇引人入胜且非常深刻的分析文章。你绝对猜不到他们的策略是什么……

Anthropic 正在租用 Elon 的 GPU 进行推理。代币短缺刚刚开始。

DeepSeek 宣布促销期后将永久降价75%

提交意见反馈