标签
Anthropic 正在从 xAI 的 Colossus 集群租用 GPU 进行推理,因为代币消耗呈指数级增长,这凸显了代币短缺问题,推高了成本并给 AI 公司的利润率带来压力。
一位开发者分享了从补贴的OpenAI Codex切换到OpenRouter后AI推理成本的经历,引发了关于当前LLM定价模式可持续性的讨论,以及可能转向开源自托管的趋势。
This article provides a comprehensive 2026 guide to free and low-cost large language models, comparing domestic (China) and international options.