@GergelyOrosz:这非常有趣。Coinbase 似乎通过1)路由到便宜的推理模型……将其代币花费($$)降低到了大约一半
摘要
据报道,Coinbase 通过智能路由到更便宜的模型(如 GLM 5.2 和 Kimi 2.7)以及实现缓存,将 AI 代币花费减少了一半,凸显了 AI 成本优化的趋势。
查看缓存全文
缓存时间: 2026/06/27 18:00
这非常有趣。Coinbase 似乎已将其代币支出(金额)削减了大约一半,方法如下:
1)将路由引导至性能依然不错的廉价推理模型,如 GLM 5.2 和 Kimi 2.7
2)智能路由 + 缓存
他们使用的代币数量与之前相同。会不会成为一种趋势?
Brian Armstrong (@brian_armstrong): 如何在代币使用量指数级增长的同时保持 AI 支出持平:不是靠设置摩擦和使用提醒,而是靠更好的默认设置、路由和缓存。
更好的默认设置(而非使用上限)——工程师可以选择任何模型,但默认设置至关重要。我们正在试验将默认模型设为……
相似文章
@rohanpaul_ai: Coinbase首席执行官Brian Armstrong表示Coinbase正在尝试默认使用中国的开源权重模型,例如GLM 5…
Coinbase首席执行官Brian Armstrong宣布,该公司正在尝试为其LLM网关使用中国的开源权重AI模型,例如GLM 5.2和Kimi 2.7,根据难度路由提示,并暗示前沿模型对于执行任务可能过于强大。
@DeRonin_: https://x.com/DeRonin_/status/2054235707791778034
一份实用指南,介绍了如何通过更智能的 Token 管理(包括多模型路由、提示词缓存和上下文纪律)来降低 80% 的 AI 编码成本,而不是简单地切换到更便宜的模型。
@DeRonin_: 我的整个AI栈现在都换成中国产品了,便宜87%。相同收入,按任务替换:1. 推理/后端大脑 Opus 4.8 → Kimi…
一位用户报告称,在推理、代码生成、智能体循环、批量处理以及图像/视频生成等方面,已将美国AI模型替换为中国替代品,实现了成本降低87%,平均质量仅下降4%,且收入未变。
@freeman1266: 通过优化策略和模型路由,将每月数千美元的 AI 编程成本大幅削减 80% 如果低效的上下文管理和盲目使用高昂模型,将会使账单飞涨。 通过实施提示词缓存、精简上下文文件以及修复工具调用的自动循环,开发者可以显著减少无效的 Token 消耗。…
本文介绍了通过提示词缓存、精简上下文、多模型路由(将日常编码任务交给Kimi 2.6,核心架构用高级模型)等策略,将AI编程成本削减80%的实用技巧。
五家中国AI实验室将Token价格最高下调99%
五家中国AI实验室在价格战中将推理Token价格下调高达99%,使得前沿推理几乎免费,竞争优势从模型转向分发和工具链。