代币账单到期：行业竞相应对AI失控成本的内幕

TechCrunch AI 2026/06/05 14:49 新闻

ai-costs token-management enterprise-ai cost-control finops ai-adoption

摘要

本文探讨了企业因代币消耗增加而面临AI成本飙升的困境，导致预算超支，并成立新的标准机构Tokenomics Foundation，以对AI代币进行成本管控。

"整个讨论从代币最大化和‘快速推进’转向了‘我们需要护栏，如何控制局面？’"

查看原文

查看缓存全文

缓存时间: 2026/06/05 17:08

# 代币账单到期：行业竞相管理AI失控成本的内幕 | TechCrunch 来源：https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/ 整个行业里，公司们开始对AI的标价望而却步。Uber在四月就花光了 (https://techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/) 整个2026年的AI编程预算。微软在启用开发者使用Claude Code几个月后就 revoked (https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad) 了这些许可证。Priceline的一位员工告诉TechCrunch，一次常规的Cursor合同续约金额涨了4到5倍。尽管每代币的价格下降了，但对AI更广泛的采用以及日益自主的代理推动代币消耗量不断攀升。在2025年初那些通过“吃到饱”订阅大快朵颐的公司，现在正手忙脚乱地搞清楚钱都花在了哪里，削减开支，并试图在预算的废墟中挽回一些ROI。与此同时，一个市场正在应运而生。初创公司、现有供应商，以及一个新的标准制定机构，都在竞相为企业提供追踪其花费的工具和语言。 “六个月前，我和客户谈话，全是问‘它能做什么？它够不够好？’”OpenAI的企业负责人Alexander Embiricos本周在纽约市的一场活动上告诉TechCrunch。“现在我们的谈话内容再也不是这些了。现在的谈话是，‘嘿，我们花得太多了。你们有什么可见性？有什么审计能力？有什么代币控制手段？你们的模型效率如何？’” 正是在这种背景下，Linux基金会本周宣布了Tokenomics Foundation的计划，这是一个新的标准制定机构，旨在为AI代币注入与FinOps为云支出带来的相同成本纪律。 “在四月和五月，我开始听到公司说：‘天哪，我们整个2026年的代币预算，才四月就超了三倍，’”Linux基金会下属的FinOps基金会执行董事J.R. Storment告诉TechCrunch。“我们开始听到存在性危机，整个对话从tokenmaxxing (https://techcrunch.com/2026/04/17/tokenmaxxing-is-making-developers-less-productive-than-they-think/) 和‘快速行动’转向了‘我们需要护栏，我们该怎么控制这个？’” 科技界响彻的这些呼声，源于CEO们狂热地要求团队使用最好的模型、快速行动，不惜成本。11月发布的新模型，如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和Google的Gemini 3 Pro，为代理工具带来了重大改进，从而大大增加了消耗。据说 (https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs) 有一家公司就因为忘记为员工设置使用上限，而收到了5亿美元的Claude账单。 “这就像可卡因流行病，”Priceline的IT财务高级总监Chris Reed说，他指出公司已经开始为一些团队设置代币上限。“他们让你先试，让你上瘾，然后你就离不开它了。” 工程运营平台Faros AI的CEO Vitaly Gordon说，他最近与一位CTO交谈，对方告诉他：“我的一名工程师上个月在代币上花了4万美元，我真的不知道是该阻止他，还是该告诉其他人都像他那样做。” Faros在3月进行的一项survey (https://www.faros.ai/blog/ai-acceleration-whiplash-takeaways) 发现，在2万名开发者中，产出在增加，但bug和重写也在增加。工程管理平台Jellyfish同样发现，使用代币最多的工程师的产出大约是较少使用AI的工程师的两倍，但他们为此消耗的代币数量却是后者的10倍。 Jellyfish研究主管Nicholas Arcolano通过电子邮件告诉TechCrunch，AI支出激增，很大程度上是由于代理功能，每个开发者的消耗量在九个月内增加了约18.6倍。总体而言，这些统计数据使得生产率方面的证据比支出所暗示的要模糊得多。 “极端支出是否值得，取决于已交付代码的最终业务价值（例如收入），而大多数公司仍然无法衡量这一点，”Arcolano说。这个衡量问题，至少部分源于当今AI被使用的巨大规模。 “追踪云成本是一个每月数亿行数据的问题，”Storment说。“追踪代币成本是一个每月数万亿行数据的问题。你不能简单地把它塞进电子表格或基础工具里。你必须从根本上重新思考你的工具、你的规格和你的会计系统才能做到这一点。” 在Priceline，Reed已经看到了差异。他指出了供应商报告的使用情况与Priceline内部数据之间的问题。 “我的职业生涯始于电信费用管理，我现在看到了从电信到云再到AI的所有相同之处，”他说。“每次引入新事物，都容易出现计费错误、审计和优化机会。” 一个市场正在围绕这个问题形成。有纯玩公司，比如Pay-i，它跟踪、衡量并优化GenAI投资的成本和性能。Paid (https://techcrunch.com/2025/09/28/paid-the-ai-agent-results-based-billing-startup-from-manny-medina-raises-huge-21m-seed/) 则让开发者可以跟踪成本、衡量使用情况，并根据实际价值（而非订阅费用）向用户收费。还有像Jellyfish、Waydev和Faros AI这样的公司，它们都提供AI代理监控来证明开发者工具的ROI。Storment说，FinOps Foundation旗下的180家供应商中，大多数都在向这个领域靠拢。拥有现有分销渠道的公司也在增加新功能，以在这个新市场中获利。Ramp最近进入了AI开支管理 (https://ramp.com/ai-cost-monitoring) 领域；Datadog (https://www.datadoghq.com/blog/manage-ai-cost-and-performance-with-datadog/) 和New Relic (https://newrelic.com/blog/apm/ai-monitoring) 则增加了云成本管理、代币级可观测性和GPU监控等服务。在即将于下周举行的FinOps X大会上，AWS预计将推出面向企业AI支出的新财务管理功能。 NEA的合伙人Tiffany Luck认为，代币效率和可观测性很可能会被添加到“工具链或应用层”。她提到了Factory，一家为企业构建AI代理的startup (https://techcrunch.com/2026/04/16/factory-hits-1-5b-valuation-to-build-ai-coding-for-enterprises/)，该公司本周launched (https://x.com/FactoryAI/status/2061862733126275549) 一个模型路由器，可以自动为每个任务选择合适的模型。 Gordon预计，前沿实验室和其他模型供应商将采用类似于OpenRouter的优化方案，将查询导向最便宜的模型——这一趋势已经出现在企业Claude账单上。 “你花在Anthropic上的财务报告，即使你调用的是Opus模型，部分开销也会落在Sonnet或Haiku上，因为他们足够聪明，会这样做，”Gordon说。“我认为这将成为越来越普遍的现象。” 但所有这些工具都是在没有通用语言或共同定义（关于一个代币多少钱、它产生什么、如何在供应商之间比较支出）的情况下构建的。这正是Tokenomics Foundation希望发挥作用的领域。该基金会正在为“tokenomics”构建一个规范的定义和框架；为AI代币使用和计费制定开放标准、规范和指标；以及制定AI经济的新指标，例如每智能成本或每瓦特代币。它还计划定义代币工厂效率和消耗效率方面的指标。该组织计划在7月正式启动，并将在下周的FinOps X大会上宣布更多成员。 “代币经济学本质上比我们以前以这种规模管理的任何东西都更抽象、更不透明，”Salesforce首席可用性官Nishant Gupta在一份声明中说。“它需要一种不同于行业为云构建的操作能力。” 话虽如此，高盛projects (https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars) 到2030年全球代币使用量将增长24倍。已经超出预算的公司现在就需要解决方案，而该基金会的第一个交付成果还需要几个月才能出来。 “也许我们造出了蒸汽机，但还没有想出装配线，”Gordon说。根据Arcolano的说法，明智的做法是广泛而适度地采用。 “最佳ROI来自于将广泛的中等用户从低使用量提升到中等使用量，而不是把重度用户推得更高，”他说。 *Russell Brandom和Tim Fernholz对本文有报道贡献。* *当您通过我们文章中的链接购买产品时，我们可能会获得少量佣金 (https://techcrunch.com/techcrunch-affiliate-monetization-standards/)。这不会影响我们的编辑独立性。*

代币账单到期：行业竞相应对AI失控成本的内幕

相似文章

AI token 使用在什么情况下会成为业务问题？

为什么AI代币会让你的企业云账单再次飙升

@levie: Token成本将成为企业未来AI应用中的主导话题。刚与许多Fortu…

为什么你的AI账单上涨了，尽管Token价格在下降（5分钟阅读）

“相当疯狂”的代币使用正在考验老板们对AI的押注

提交意见反馈