公司让Claude和Codex像穴居人一样说话,以遏制AI成本飙升
摘要
公司正在采用一款名为“Caveman”的插件,强制Claude和Codex等AI模型使用简短的穴居人式语言,以减少令牌消耗并遏制不断飙升的AI成本。该工具可将输出令牌削减高达75%,目前已被OpenAI、Nvidia、GitHub和Legrand的员工使用。
暂无内容
查看缓存全文
缓存时间: 2026/06/30 15:49
# 公司让Claude和Codex像穴居人一样说话,以遏制AI成本飙升
来源:https://www.404media.co/companies-are-making-claude-and-codex-talk-like-cavemen-to-stop-ais-soaring-costs/
404 Media发现,公司正在故意让它们的AI工具像穴居人(caveman)一样说话,试图减少AI token消耗,遏制巨额AI开支。这个工具让通常啰嗦的LLM(如Claude Code、Codex或Gemini)的回答变得简洁扼要。不再是“你说得对,我错了”,而是“绿巨人砸”。
穴居人插件的使用,直接回应了AI成本飙升且不可预测的问题。正如404 Media此前报道(https://www.404media.co/the-tokenpocalypse-is-here-companies-are-scrambling-to-stop-spending-so-much-on-ai/),公司正竭力控制AI支出;咨询巨头埃森哲发现,“token支出暴涨”很大程度上源于人们用AI将PDF转换为演示文稿。根据该工具创建者的说法,使用穴居人的开发者包括OpenAI、Nvidia和GitHub的员工。一名OpenAI高级员工甚至为该项目贡献了代码,添加了对OpenAI Codex工具的支持。
💡
****你知道公司内部token支出的更多情况吗?我很期待听听你的想法。使用非工作设备,你可以通过Signal安全联系我(joseph.404),或发送邮件至[email protected]。****
“我在四月初做了穴居人,因为我大量使用Claude Code,发现很多token花费在了不必要的废话上:客套话、模棱两可、过渡词和闲聊语言——这些在agent循环中根本不重要,”穴居人创建者Julius Brussee告诉404 Media。
一家使用穴居人的公司是电气数字基础设施巨头Legrand,讽刺的是,该公司已进军数据中心业务。一份与404 Media共享的Legrand内部备忘录告诉员工:“由于计费系统变更以及新配额已实施,我们所有人需要注意AI使用量,以免过快用尽整个预算额度。”备忘录接着列出了四项能产生“高影响”的措施:不要总使用最强大的模型;不要总对LLM使用高推理设置;针对不同任务使用不同的更合适的模型;最后,“使用‘穴居人技能’减少输出消耗(不影响代码)。”
在404 Media对Claude Code进行穴居人测试时,该插件确实让LLM的回答更加切中要点。“想修改吗?”LLM在我要求它检查之前编写的代码后问道。“使用官方API,而非抓取,”LLM补充说明代码是如何工作的。当我再次确认穴居人已安装时,Claude输出:“已激活。你需要什么?”
穴居人还会显示所称的已节省的总token数。就我而言,穴居人说我节省了约5800个token,即65%。
穴居人运行截图。“它让模型不再像礼貌的聊天机器人,而更像一个简洁的工具,”Brussee说。“内容相同,用词更少。在我的评估中,穴居人比默认啰嗦输出减少了约65-75%的输出token,而且仍然胜过普通的‘简洁’指令。这个数字因工作流程而异,但效果很明显。”
穴居人用户可以选择自己的“咕噜”级别:lite、full(默认设置)、ultra,或者wenyan——它将输出翻译为文言汉字(我验证了这一点,现在完全不知道Claude输出了什么)。
“目标是在精确性重要的部分(代码、命令、路径、URL、数字、函数名和技术细节)不受影响的情况下减少输出token。穴居人主要是压缩周围的文字,”Brussee补充道。
GitHub上的记录显示,OpenAI工程总监Shayne Sweeney为穴居人贡献了代码。几个月前的提交(https://github.com/shayne/caveman?ref=404media.co)写道:“添加Codex插件支持。”
穴居人运行截图。穴居人还提供了一个完整的agent,将所有内容压缩为穴居人语言。“caveman-code 收缩一切——全终端编码agent,从头到尾都是穴居人风格。在相同任务上token比Codex减少约2倍。20+提供商·计划模式·自动执行目标循环·MIT,”穴居人的GitHub仓库(https://github.com/JuliusBrussee/caveman?ref=404media.co)写道。穴居人也可以与OpenClaw(https://www.404media.co/silicon-valleys-favorite-new-ai-agent-has-serious-security-flaws/)一起使用,这是今年早些时候大火的agentic AI工具。
这个插件显然很有趣,但它是对一个非常现实问题的回应。四月份,GitHub宣布将开始按token向客户收费(https://www.wheresyoured.at/news-microsoft-to-shift-github-copilot-users-to-token-based-billing-reduce-rate-limits-2/?ref=404media.co),而非固定订阅费。Uber限制了员工使用AI工具(https://www.bloomberg.com/news/articles/2026-06-02/uber-caps-usage-of-ai-tools-like-claude-code-to-cut-costs?utm_source=website&utm_medium=share&utm_campaign=twitter&embedded-checkout=true),公司CTO表示Uber在四个月内就花光了整个AI预算(https://www.theinformation.com/newsletters/applied-ai/uber-cto-shows-claude-code-can-blow-ai-budgets?im_ref=zELUMKyRUxycRDfQPrT4BXOzUkuT9UW3mwKY000&sharedid=techcrunch.com&irpid=10078&utm_term=techcrunch.com&irgwc=1&afsrc=1&utm_source=affiliate&utm_medium=cpa&utm_campaign=10078-Skimbit+Ltd.)。Walmart也限制了AI工具使用(https://finance.yahoo.com/sectors/technology/articles/walmart-caps-usage-ai-tool-150006460.html?ref=404media.co)。而现在,公司们正在使用穴居人。
“我听到了许多公司内部开发者或工程师的使用或测试反馈,包括OpenAI、NVIDIA、GitHub和DEPT的人,”Brussee说。
在404 Media获得的泄露音频中(https://www.404media.co/the-tokenpocalypse-is-here-companies-are-scrambling-to-stop-spending-so-much-on-ai/),埃森哲将自己定位为该问题的解药,尽管它当初鼓励客户尽快采用AI。在那段音频中,一名高级员工表示埃森哲与客户有了新的机会,“真正思考token经济学”。
去年,OpenAI CEO Sam Altman表示,人们向LLM表达客套话(如“请”和“谢谢”)让OpenAI花费了数千万美元的电费(https://www.usatoday.com/story/tech/2025/04/22/please-thank-you-chatgpt-openai-energy-costs/83207447007/?ref=404media.co)。
Legrand、OpenAI、Nvidia和GitHub未就穴居人使用情况回应置评请求。
穴居人的GitHub仓库末尾写道:“穴居人省token,省钱。”
关于作者
Joseph是一位屡获殊荣的调查记者,专注于产生影响力。他的工作引发了数亿美元的罚款,关闭了多家科技公司,等等。
Joseph Cox
相似文章
教 Claude 像穴居人一样说话,Token 用量减少 75%
一名用户尝试通过提示让 Claude 简洁交流,使 Token 用量降低了 75%,同时监测此举对模型智能的潜在影响。
@_avichawla: 更聪明的 Claude 模型消耗的 tokens 更多,而不是更少!而且这不是 3-5% 的微小差异,而是高出 54% 的 token 使用量。…
本文分析了为何像 Claude 这样更智能的 AI Agent 在与 Supabase 等以人类为中心的后端交互时会消耗更多 Token,主要原因在于上下文发现效率低下。文章引入了 InsForge,这是一款专为 Agent 设计的开源后端工具,通过提供结构化的上下文来显著降低 Token 用量和人工干预。
@DataChaz: 停止浪费你的Token!如果你使用Claude Code,你可能浪费了80%的上下文窗口。我找到了10个超棒工具…
由@DataChaz发布的一条推文列出了10个开源工具,用于大幅降低Claude Code及类似AI编程助手的Token使用量,通过各种优化手段可将API费用削减75%-98%。
我应该从Claude Code迁移到Codex吗?
本文对比了Anthropic的Claude Code和OpenAI的Codex,帮助开发者决定选择哪个AI编码工具。
优步限制使用Claude Code等AI工具以控制成本
据报道,优步提前用完了其2026年的AI预算,因此正限制员工在Claude Code等AI编码工具上的支出,每工具每月不超过1500美元,以控制成本。这一政策突显了智能编程软件日益高昂的费用。