标签
本文分析了 Bai 等人 2026 年的论文,该论文表明,子代理和上下文膨胀导致长代理运行中的Token成本比普通聊天高出约1000倍,并提出了三种实用的修复方法(PLAN.md、读取预算、带外备注),可将Token使用量减少70-90%。
高盛预测,到2030年,人工智能代理的Token使用量将增长24倍,并引用成本担忧,Uber和微软正在重新考虑使用昂贵的代理,凸显了人工智能繁荣的一个关键挑战。
对AI编程代理成本的分析显示,代理工作流消耗的token数可达简单ChatGPT调用的3500倍,大部分浪费来自冗余的上下文加载。文章建议追踪重复的文件操作并使用高效模型降低成本。
Token成本正成为企业采用AI的关键关注点,CIO们难以管理不同模型和用例的开支。OpenAI宣布推出Guaranteed Capacity以解决长期计算资源获取问题。
Google的Antigravity 2.0 使用96个AI代理自主在12小时内创建功能完整的操作系统,代币成本低于1000美元,并且能运行游戏Doom。