代币账单到期:行业竞相应对AI失控成本的内幕

TechCrunch AI 新闻

摘要

本文探讨了企业因代币消耗增加而面临AI成本飙升的困境,导致预算超支,并成立新的标准机构Tokenomics Foundation,以对AI代币进行成本管控。

"整个讨论从代币最大化和‘快速推进’转向了‘我们需要护栏,如何控制局面?’"
查看原文
查看缓存全文

缓存时间: 2026/06/05 17:08

# 代币账单到期:行业竞相管理AI失控成本的内幕 | TechCrunch 来源:https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/ 整个行业里,公司们开始对AI的标价望而却步。Uber在四月就花光了 (https://techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/) 整个2026年的AI编程预算。微软在启用开发者使用Claude Code几个月后就 revoked (https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad) 了这些许可证。Priceline的一位员工告诉TechCrunch,一次常规的Cursor合同续约金额涨了4到5倍。 尽管每代币的价格下降了,但对AI更广泛的采用以及日益自主的代理推动代币消耗量不断攀升。在2025年初那些通过“吃到饱”订阅大快朵颐的公司,现在正手忙脚乱地搞清楚钱都花在了哪里,削减开支,并试图在预算的废墟中挽回一些ROI。 与此同时,一个市场正在应运而生。初创公司、现有供应商,以及一个新的标准制定机构,都在竞相为企业提供追踪其花费的工具和语言。 “六个月前,我和客户谈话,全是问‘它能做什么?它够不够好?’”OpenAI的企业负责人Alexander Embiricos本周在纽约市的一场活动上告诉TechCrunch。“现在我们的谈话内容再也不是这些了。现在的谈话是,‘嘿,我们花得太多了。你们有什么可见性?有什么审计能力?有什么代币控制手段?你们的模型效率如何?’” 正是在这种背景下,Linux基金会本周宣布了Tokenomics Foundation的计划,这是一个新的标准制定机构,旨在为AI代币注入与FinOps为云支出带来的相同成本纪律。 “在四月和五月,我开始听到公司说:‘天哪,我们整个2026年的代币预算,才四月就超了三倍,’”Linux基金会下属的FinOps基金会执行董事J.R. Storment告诉TechCrunch。“我们开始听到存在性危机,整个对话从tokenmaxxing (https://techcrunch.com/2026/04/17/tokenmaxxing-is-making-developers-less-productive-than-they-think/) 和‘快速行动’转向了‘我们需要护栏,我们该怎么控制这个?’” 科技界响彻的这些呼声,源于CEO们狂热地要求团队使用最好的模型、快速行动,不惜成本。11月发布的新模型,如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和Google的Gemini 3 Pro,为代理工具带来了重大改进,从而大大增加了消耗。据说 (https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs) 有一家公司就因为忘记为员工设置使用上限,而收到了5亿美元的Claude账单。 “这就像可卡因流行病,”Priceline的IT财务高级总监Chris Reed说,他指出公司已经开始为一些团队设置代币上限。“他们让你先试,让你上瘾,然后你就离不开它了。” 工程运营平台Faros AI的CEO Vitaly Gordon说,他最近与一位CTO交谈,对方告诉他:“我的一名工程师上个月在代币上花了4万美元,我真的不知道是该阻止他,还是该告诉其他人都像他那样做。” Faros在3月进行的一项survey (https://www.faros.ai/blog/ai-acceleration-whiplash-takeaways) 发现,在2万名开发者中,产出在增加,但bug和重写也在增加。工程管理平台Jellyfish同样发现,使用代币最多的工程师的产出大约是较少使用AI的工程师的两倍,但他们为此消耗的代币数量却是后者的10倍。 Jellyfish研究主管Nicholas Arcolano通过电子邮件告诉TechCrunch,AI支出激增,很大程度上是由于代理功能,每个开发者的消耗量在九个月内增加了约18.6倍。总体而言,这些统计数据使得生产率方面的证据比支出所暗示的要模糊得多。 “极端支出是否值得,取决于已交付代码的最终业务价值(例如收入),而大多数公司仍然无法衡量这一点,”Arcolano说。 这个衡量问题,至少部分源于当今AI被使用的巨大规模。 “追踪云成本是一个每月数亿行数据的问题,”Storment说。“追踪代币成本是一个每月数万亿行数据的问题。你不能简单地把它塞进电子表格或基础工具里。你必须从根本上重新思考你的工具、你的规格和你的会计系统才能做到这一点。” 在Priceline,Reed已经看到了差异。他指出了供应商报告的使用情况与Priceline内部数据之间的问题。 “我的职业生涯始于电信费用管理,我现在看到了从电信到云再到AI的所有相同之处,”他说。“每次引入新事物,都容易出现计费错误、审计和优化机会。” 一个市场正在围绕这个问题形成。有纯玩公司,比如Pay-i,它跟踪、衡量并优化GenAI投资的成本和性能。Paid (https://techcrunch.com/2025/09/28/paid-the-ai-agent-results-based-billing-startup-from-manny-medina-raises-huge-21m-seed/) 则让开发者可以跟踪成本、衡量使用情况,并根据实际价值(而非订阅费用)向用户收费。 还有像Jellyfish、Waydev和Faros AI这样的公司,它们都提供AI代理监控来证明开发者工具的ROI。Storment说,FinOps Foundation旗下的180家供应商中,大多数都在向这个领域靠拢。 拥有现有分销渠道的公司也在增加新功能,以在这个新市场中获利。Ramp最近进入了AI开支管理 (https://ramp.com/ai-cost-monitoring) 领域;Datadog (https://www.datadoghq.com/blog/manage-ai-cost-and-performance-with-datadog/) 和New Relic (https://newrelic.com/blog/apm/ai-monitoring) 则增加了云成本管理、代币级可观测性和GPU监控等服务。在即将于下周举行的FinOps X大会上,AWS预计将推出面向企业AI支出的新财务管理功能。 NEA的合伙人Tiffany Luck认为,代币效率和可观测性很可能会被添加到“工具链或应用层”。她提到了Factory,一家为企业构建AI代理的startup (https://techcrunch.com/2026/04/16/factory-hits-1-5b-valuation-to-build-ai-coding-for-enterprises/),该公司本周launched (https://x.com/FactoryAI/status/2061862733126275549) 一个模型路由器,可以自动为每个任务选择合适的模型。 Gordon预计,前沿实验室和其他模型供应商将采用类似于OpenRouter的优化方案,将查询导向最便宜的模型——这一趋势已经出现在企业Claude账单上。 “你花在Anthropic上的财务报告,即使你调用的是Opus模型,部分开销也会落在Sonnet或Haiku上,因为他们足够聪明,会这样做,”Gordon说。“我认为这将成为越来越普遍的现象。” 但所有这些工具都是在没有通用语言或共同定义(关于一个代币多少钱、它产生什么、如何在供应商之间比较支出)的情况下构建的。这正是Tokenomics Foundation希望发挥作用的领域。 该基金会正在为“tokenomics”构建一个规范的定义和框架;为AI代币使用和计费制定开放标准、规范和指标;以及制定AI经济的新指标,例如每智能成本或每瓦特代币。它还计划定义代币工厂效率和消耗效率方面的指标。该组织计划在7月正式启动,并将在下周的FinOps X大会上宣布更多成员。 “代币经济学本质上比我们以前以这种规模管理的任何东西都更抽象、更不透明,”Salesforce首席可用性官Nishant Gupta在一份声明中说。“它需要一种不同于行业为云构建的操作能力。” 话虽如此,高盛projects (https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars) 到2030年全球代币使用量将增长24倍。已经超出预算的公司现在就需要解决方案,而该基金会的第一个交付成果还需要几个月才能出来。 “也许我们造出了蒸汽机,但还没有想出装配线,”Gordon说。 根据Arcolano的说法,明智的做法是广泛而适度地采用。 “最佳ROI来自于将广泛的中等用户从低使用量提升到中等使用量,而不是把重度用户推得更高,”他说。 *Russell Brandom和Tim Fernholz对本文有报道贡献。* *当您通过我们文章中的链接购买产品时,我们可能会获得少量佣金 (https://techcrunch.com/techcrunch-affiliate-monetization-standards/)。这不会影响我们的编辑独立性。*

相似文章

AI token 使用在什么情况下会成为业务问题?

Reddit r/AI_Agents

文章强调了AI token使用经济性在大规模应用时被低估的挑战,讨论了随着组织从概念验证转向企业级部署,成本如何成为治理问题。它提出了关于成本可见性、监控以及平衡性能与成本的问题。

每个AI提示都需花费成本——这改变了一切

Reddit r/AI_Agents

文章认为,AI的真正挑战不仅在于构建更智能的模型,更在于以规模化的方式降低成本效率,强调了减少token使用、提升速度以及优化基础设施的重要性。

AI编码工具是否正在成为新的云账单问题?

Reddit r/artificial

本文将AI编码工具日益增长的成本与早期云计算进行比较,突出了token使用量、代码审查和维护等隐藏费用,并对团队是否追踪每个工作流的真实成本提出疑问。