@GergelyOrosz:这非常有趣。Coinbase 似乎通过1)路由到便宜的推理模型……将其代币花费($$)降低到了大约一半

X AI KOLs Following 新闻

摘要

据报道,Coinbase 通过智能路由到更便宜的模型(如 GLM 5.2 和 Kimi 2.7)以及实现缓存,将 AI 代币花费减少了一半,凸显了 AI 成本优化的趋势。

这非常有趣。Coinbase 似乎通过以下方式将其代币花费($$)降低到了大约一半: 1) 路由到便宜的推理模型,如 GLM 5.2 和 Kimi 2.7,这些模型仍然性能不错 2) 智能路由 + 缓存 他们仍然使用与以前相同的代币。这是趋势的开始吗?
查看原文
查看缓存全文

缓存时间: 2026/06/27 18:00

这非常有趣。Coinbase 似乎已将其代币支出(金额)削减了大约一半,方法如下:

1)将路由引导至性能依然不错的廉价推理模型,如 GLM 5.2 和 Kimi 2.7
2)智能路由 + 缓存

他们使用的代币数量与之前相同。会不会成为一种趋势?

Brian Armstrong (@brian_armstrong): 如何在代币使用量指数级增长的同时保持 AI 支出持平:不是靠设置摩擦和使用提醒,而是靠更好的默认设置、路由和缓存。

更好的默认设置(而非使用上限)——工程师可以选择任何模型,但默认设置至关重要。我们正在试验将默认模型设为……

相似文章

@freeman1266: 通过优化策略和模型路由,将每月数千美元的 AI 编程成本大幅削减 80% 如果低效的上下文管理和盲目使用高昂模型,将会使账单飞涨。 通过实施提示词缓存、精简上下文文件以及修复工具调用的自动循环,开发者可以显著减少无效的 Token 消耗。…

X AI KOLs Timeline

本文介绍了通过提示词缓存、精简上下文、多模型路由(将日常编码任务交给Kimi 2.6,核心架构用高级模型)等策略,将AI编程成本削减80%的实用技巧。