@GergelyOrosz：这非常有趣。Coinbase 似乎通过1）路由到便宜的推理模型……将其代币花费（$$）降低到了大约一半

X AI KOLs Following 2026/06/27 05:04 新闻

ai-cost-optimization inference-routing caching coinbase model-routing

摘要

据报道，Coinbase 通过智能路由到更便宜的模型（如 GLM 5.2 和 Kimi 2.7）以及实现缓存，将 AI 代币花费减少了一半，凸显了 AI 成本优化的趋势。

这非常有趣。Coinbase 似乎通过以下方式将其代币花费（$$）降低到了大约一半： 1) 路由到便宜的推理模型，如 GLM 5.2 和 Kimi 2.7，这些模型仍然性能不错 2) 智能路由 + 缓存他们仍然使用与以前相同的代币。这是趋势的开始吗？

查看原文

查看缓存全文

缓存时间: 2026/06/27 18:00

这非常有趣。Coinbase 似乎已将其代币支出（金额）削减了大约一半，方法如下：

1）将路由引导至性能依然不错的廉价推理模型，如 GLM 5.2 和 Kimi 2.7
2）智能路由 + 缓存

他们使用的代币数量与之前相同。会不会成为一种趋势？

Brian Armstrong (@brian_armstrong): 如何在代币使用量指数级增长的同时保持 AI 支出持平：不是靠设置摩擦和使用提醒，而是靠更好的默认设置、路由和缓存。

更好的默认设置（而非使用上限）——工程师可以选择任何模型，但默认设置至关重要。我们正在试验将默认模型设为……

相似文章

@rohanpaul_ai: Coinbase首席执行官Brian Armstrong表示Coinbase正在尝试默认使用中国的开源权重模型，例如GLM 5…

X AI KOLs Timeline

Coinbase首席执行官Brian Armstrong宣布，该公司正在尝试为其LLM网关使用中国的开源权重AI模型，例如GLM 5.2和Kimi 2.7，根据难度路由提示，并暗示前沿模型对于执行任务可能过于强大。

@DeRonin_: https://x.com/DeRonin_/status/2054235707791778034

X AI KOLs Following

一份实用指南，介绍了如何通过更智能的 Token 管理（包括多模型路由、提示词缓存和上下文纪律）来降低 80% 的 AI 编码成本，而不是简单地切换到更便宜的模型。

@DeRonin_: 我的整个AI栈现在都换成中国产品了，便宜87%。相同收入，按任务替换：1. 推理/后端大脑 Opus 4.8 → Kimi…

X AI KOLs Following

一位用户报告称，在推理、代码生成、智能体循环、批量处理以及图像/视频生成等方面，已将美国AI模型替换为中国替代品，实现了成本降低87%，平均质量仅下降4%，且收入未变。

@freeman1266: 通过优化策略和模型路由，将每月数千美元的 AI 编程成本大幅削减 80% 如果低效的上下文管理和盲目使用高昂模型，将会使账单飞涨。通过实施提示词缓存、精简上下文文件以及修复工具调用的自动循环，开发者可以显著减少无效的 Token 消耗。…

X AI KOLs Timeline

本文介绍了通过提示词缓存、精简上下文、多模型路由（将日常编码任务交给Kimi 2.6，核心架构用高级模型）等策略，将AI编程成本削减80%的实用技巧。

五家中国AI实验室将Token价格最高下调99%

Reddit r/ArtificialInteligence

五家中国AI实验室在价格战中将推理Token价格下调高达99%，使得前沿推理几乎免费，竞争优势从模型转向分发和工具链。

提交意见反馈