Anthropic 正在租用 Elon 的 GPU 进行推理。代币短缺刚刚开始。

Reddit r/AI_Agents 新闻

摘要

Anthropic 正在从 xAI 的 Colossus 集群租用 GPU 进行推理,因为代币消耗呈指数级增长,这凸显了代币短缺问题,推高了成本并给 AI 公司的利润率带来压力。

Elon 赢了。他是唯一有能力大规模出售代币的人,就在代币短缺正式开始的时候。新闻中隐藏的一个有趣细节:Anthropic 已经在从 xAI 租用 Colossus 1 进行推理。他们的竞争对手实际上运行在 Musk 的硬件上。规模正在爆炸式增长。 Google:从 9.7T 到 3.2 千万亿代币/月(2024年5月 → 2026年5月)。Azure Foundry:同比增长 7 倍,通过 Foundry API 处理超过 500T 代币。代币消耗的增长速度比价格下降速度快两个数量级。**补贴已经结束。** OpenAI 泄露的内部数据显示,2026 年预计亏损 140 亿美元,营收 130 亿美元。他们每赚 1 美元就烧掉 1.69 美元,而整个差额都来自推理。Anthropic 的毛利率约为 40%,OpenAI 约为 33%。两者都低于 SaaS 标准的 70-80%。Cursor 取消了无限量套餐(2025 年 6 月)。Claude Code 限制了 Pro 和 Max 的使用(2025 年 8 月)。GitHub Copilot 完全转向基于用量计费(2026 年 6 月)。这种模式不断重复,因为数学迫使它如此。 随着 OpenAI 和 Anthropic 申请 IPO,他们将通过提高 API 价格来缩小差距。他们的利润现在就是你的成本。**作为推出 AI 产品的创始人,你该如何生存?** 1. 全面的成本可见性。你需要按客户、按智能体、按工作流的实时成本,而不是月末结算。如果在 AWS 账单送达时才发现哪些客户不盈利,你已经深陷困境了。这正是我们构建 Credyt 的目的:在 LLM API 支出之上实现实时计量,并支持按客户、按智能体、按工作流进行归属。没有这一层,接下来的三条规则都只是猜测。 2. 按细分市场进行成本与价值计算。你的利润存在于客户使用成本与其从中获取的价值之间的差距。如果某个细分市场没有获得足够价值,将他们切换到更便宜的模型或自托管。如果他们获得了很多价值,就提高价格。大多数创始人跳过了细分步骤,对所有人统一定价,这就是重度用户蚕食利润的方式。 3. 大声证明价值。除非客户能看到他们得到了什么,否则他们不会接受涨价。数据、故事、前后对比。展示工作流节省了 14 小时的分析师时间,支持自助分流节省了 X 美元,转化率提升带来了 Y 美元。价值存在于客户的话语和指标中,而不是你的。 代币成本正在上升。成本将落在构建者身上。能够生存下来的创始人,是那些无需打开电子表格就能回答“这个客户现在花了我多少钱”的人。
查看原文

相似文章

AI Gateway 生产趋势(阅读时间8分钟)

TLDR AI

Vercel 的 AI Gateway 数据显示,Anthropic 在支出方面领先,Google 在 Token 量方面领先,而代理型工作负载占 Token 总量的 59%。OpenAI 的支出份额在最近的模型更新后增长了近两倍。