科技公司能否学会青睐更便宜的AI模型?

TechCrunch AI 新闻

摘要

TechCrunch报道称,随着成本不断攀升,企业开始考虑转向更便宜、更小的AI模型,而非始终使用最强大的模型,这可能引发行业转变。布赖恩·阿姆斯特朗等人的预测表明,12-18个月内,80%的工作负载可能运行在价格便宜99%的模型上,这将严重冲击OpenAI和Anthropic等主要AI实验室。

如果同样的AI工作负载可以由更便宜的模型处理而不影响质量,那将意味着AI经济学发生巨大转变。
查看原文
查看缓存全文

缓存时间: 2026/06/10 00:15

# 科技公司能学会喜爱更便宜的AI模型吗?| TechCrunch 来源:https://techcrunch.com/2026/06/09/can-tech-companies-learn-to-love-cheaper-models/ AI热潮建立在一个基本假设之上:更大的模型更强大,而最强大的模型获胜。如今,行业即将认识到,如果这一假设开始瓦解会发生什么。 不断攀升的成本已经迫使用户重新审视更小、更便宜的模型。这种注重成本的模型挑选行为是全新的,目前尚不清楚它将如何影响整个行业,但影响可能十分显著。 Coinbase联合创始人Brian Armstrong提出的一种预测是,这将导致绝大多数任务转向更便宜的模型。 他在X上写道:“对智能的需求近乎无限,但12-18个月内,80%的工作负载将运行在便宜99%的模型上。20%的工作负载仍将运行在最新一代模型上,因为那里需要最大化智商水平。” 如果Armstrong的预测成真,这对AI行业来说将是一个重大的转变,怎么强调都不为过。 在此之前,大多数AI公司都在质量上竞争,这意味着默认使用最先进的可用模型。如果同样的工作可以由更便宜的模型在不降低质量的情况下完成,那将意味着AI经济学的巨大转变。关键在于,大部分节省下来的成本将来自大型实验室的口袋,给即将进行IPO的OpenAI和Anthropic带来财务打击。 这可能是行业的一场地震式变革,其基础只有一个基本问题:企业准备好转向更小的模型了吗? 初步测试表明,当系统设置得当,更便宜的模型可以在不牺牲质量的情况下替代使用。在法律AI工具Harvey最近的一项测试中,该公司在不降低质量的情况下将推理成本降低了3倍。这项与推理平台Fireworks AI合作进行的测试,结合了Claude Opus和Fireworks的GLM 5.1,并在最密集的任务中切换至Opus。结果是在服务器时间和总体成本方面显著降低了负载。 “质量第一,在法律领域永远如此,”Harvey联合创始人Gabe Pereyra告诉TechCrunch,指的是他的初创公司提供的AI法律服务。“然而,质量的定义正在从‘无论做什么都使用最强大的模型’,演变为‘使用能够最有效得到正确答案的最佳模型’。” 这种趋势通常被描述为大型实验室与中国模型或开放权重模型之间的对立,但这忽略了更重要的一点。真正的分歧不在于专有模型和开放模型之间,而在于大模型和小模型之间。从GPT-5.5切换到DeepSeek V4 Flash可以省钱,但切换到GPT-5.4-mini同样有效。 大型实验室的内部推理与独立服务的开放权重模型之间正在进行一场价格战。对于小模型与大模型这个更大的问题,哪种小模型最终获胜其实并不重要。 这一切可能看起来很显而易见——当然不应该使用超出必要的计算资源——但这与迄今为止主导行业的“规模优先”方法背道而驰。受到惨痛教训的启发,实验室一直大力投入训练尽可能计算密集的模型,推动AI模型能力的前沿。由于价格被投资者大幅补贴,客户没有理由选择除了最先进选项之外的任何东西。 随着Token价格上涨和补贴放缓,用户首次面临成本压力。我们不知道新的成本压力是否真正会推动企业用户转向更小的模型。他们同样可以通过减少调用次数、使用更少的上下文,或者干脆放弃最没有前景的部署来节约成本。 但如果事实证明,大多数部署都可以在较小的模型上良好运行,那么这可能会严重抑制推理需求的增长,并引发关于如何证明训练前沿模型成本合理的新问题。 *当您通过我们文章中的链接购买商品时,我们可能会获得少量佣金。这不会影响我们的编辑独立性。* Russell Brandom自2012年以来一直报道科技行业,重点关注平台政策和新兴技术。他曾在The Verge和Rest of World工作,并为Wired、The Awl和MIT Technology Review撰稿。可以通过[email protected]或Signal(412-401-5489)联系他。 查看作者简介

相似文章

每个AI提示都需花费成本——这改变了一切

Reddit r/AI_Agents

文章认为,AI的真正挑战不仅在于构建更智能的模型,更在于以规模化的方式降低成本效率,强调了减少token使用、提升速度以及优化基础设施的重要性。