标签
Scott Galloway与Ed Nelson探讨了AI采用成本不断上升的问题,Uber、Microsoft和Salesforce等公司报告称AI支出超出预算且尚未带来明确的ROI,暗示可能出现市场修正。
作者引入了一个针对软件公司的新财务指标EBIT(Earnings Before Inference Tokens),目标是实现75%的增长率。
将AI token消耗类比为数字员工薪资,预测token费用将与员工工资持平或超过,并讨论企业如何衡量投入产出比及控制成本。
关于AI行业泡沫的讨论,指出投资未能跟上消费者需求,导致服务限制和潜在的价格不可承受。作者认为,估值过高和投机性投资将引发回调,影响较小的参与者。
微软因按Token计费带来意外高昂成本,已取消内部使用的Anthropic Claude Code许可证,这凸显了更广泛的行业趋势——AI使用在数月内就耗尽全年预算。
OpenAI正为Y Combinator的初创公司提供价值200万美元的代币,这可能大大降低AI代币的价格,并解决消费级AI想法的成本问题。
微软因基于代币的成本难以为继而取消了内部 Claude Code 许可证;Uber 在四个月内烧光了其 2026 年的人工智能预算。这标志着人工智能补贴时代的终结,企业预算与不断上涨的模型价格发生冲突。
本文讨论了来自中国实验室和其他竞争对手的廉价AI模型的日益普及如何在OpenAI和Anthropic计划IPO之前威胁其估值和市场地位,因为企业客户越来越寻求具有成本效益的替代方案。
一位开发者分享了导致AI账单超出预期的隐性成本变量,包括推理模型的思维链token、多模态每张图片费用、函数调用系统token,并询问社区是如何提前预测成本的。
Token成本正成为企业采用AI的关键关注点,CIO们难以管理不同模型和用例的开支。OpenAI宣布推出Guaranteed Capacity以解决长期计算资源获取问题。
讨论大规模 AI 代理运营中成本管理的有效 FinOps 策略,涵盖模型路由、提示词精简、缓存等策略,以及按代理、工作流和客户跟踪成本的需求。
文章认为,AI的真正挑战不仅在于构建更智能的模型,更在于以规模化的方式降低成本效率,强调了减少token使用、提升速度以及优化基础设施的重要性。
前谷歌CEO埃里克·施密特表示,AI的真正限制在于资金而非能源。他估计,10吉瓦的计算能力可能耗资5000亿美元,只有美国或中国等少数实体才能负担得起。
研究机构正面临来自OpenAI和GitHub等供应商日益增长的AI订阅费用及使用限制,引发了关于科学研究中成本效益比的质疑。