Anthropic 正在租用 Elon 的 GPU 进行推理。代币短缺刚刚开始。

Reddit r/AI_Agents 2026/06/15 21:00 新闻

inference-costs token-shortage ai-economics cloud-gpu llm-pricing early-stage-founders cost-metering

摘要

Anthropic 正在从 xAI 的 Colossus 集群租用 GPU 进行推理，因为代币消耗呈指数级增长，这凸显了代币短缺问题，推高了成本并给 AI 公司的利润率带来压力。

Elon 赢了。他是唯一有能力大规模出售代币的人，就在代币短缺正式开始的时候。新闻中隐藏的一个有趣细节：Anthropic 已经在从 xAI 租用 Colossus 1 进行推理。他们的竞争对手实际上运行在 Musk 的硬件上。规模正在爆炸式增长。 Google：从 9.7T 到 3.2 千万亿代币/月（2024年5月 → 2026年5月）。Azure Foundry：同比增长 7 倍，通过 Foundry API 处理超过 500T 代币。代币消耗的增长速度比价格下降速度快两个数量级。**补贴已经结束。** OpenAI 泄露的内部数据显示，2026 年预计亏损 140 亿美元，营收 130 亿美元。他们每赚 1 美元就烧掉 1.69 美元，而整个差额都来自推理。Anthropic 的毛利率约为 40%，OpenAI 约为 33%。两者都低于 SaaS 标准的 70-80%。Cursor 取消了无限量套餐（2025 年 6 月）。Claude Code 限制了 Pro 和 Max 的使用（2025 年 8 月）。GitHub Copilot 完全转向基于用量计费（2026 年 6 月）。这种模式不断重复，因为数学迫使它如此。随着 OpenAI 和 Anthropic 申请 IPO，他们将通过提高 API 价格来缩小差距。他们的利润现在就是你的成本。**作为推出 AI 产品的创始人，你该如何生存？** 1. 全面的成本可见性。你需要按客户、按智能体、按工作流的实时成本，而不是月末结算。如果在 AWS 账单送达时才发现哪些客户不盈利，你已经深陷困境了。这正是我们构建 Credyt 的目的：在 LLM API 支出之上实现实时计量，并支持按客户、按智能体、按工作流进行归属。没有这一层，接下来的三条规则都只是猜测。 2. 按细分市场进行成本与价值计算。你的利润存在于客户使用成本与其从中获取的价值之间的差距。如果某个细分市场没有获得足够价值，将他们切换到更便宜的模型或自托管。如果他们获得了很多价值，就提高价格。大多数创始人跳过了细分步骤，对所有人统一定价，这就是重度用户蚕食利润的方式。 3. 大声证明价值。除非客户能看到他们得到了什么，否则他们不会接受涨价。数据、故事、前后对比。展示工作流节省了 14 小时的分析师时间，支持自助分流节省了 X 美元，转化率提升带来了 Y 美元。价值存在于客户的话语和指标中，而不是你的。代币成本正在上升。成本将落在构建者身上。能够生存下来的创始人，是那些无需打开电子表格就能回答“这个客户现在花了我多少钱”的人。

查看原文

Anthropic 正在租用 Elon 的 GPU 进行推理。代币短缺刚刚开始。

相似文章

Anthropic每年支付150亿美元以获得Elon Musk数据中心的访问权限

Anthropic每月将向xAI支付12.5亿美元用于计算能力

Anthropic 在实现80倍增长、估值达1.2万亿美元后，获得SpaceX Colossus 1 计算资源

Anthropic实现盈利，而xAI亏损42亿美元。AI盈利数据终于泄露。[D]

AI Gateway 生产趋势（阅读时间8分钟）

提交意见反馈