每月花费2500美元使用Sonnet/Opus——是否值得更多转向GPT-5.5/Codex?
摘要
一位用户讨论如何优化每月2500美元的AI API支出,比较Anthropic的Sonnet/Opus与GPT-5.5/Codex在编程和商业任务上的表现,寻求社区关于成本与质量权衡的建议。
目前我每月在Sonnet 4.6上花费约2000–2500美元,其中约有5%用于Opus 4.7,主要通过Anthropic API进行开发和业务管理。说实话,我对这个投入的回报非常满意。但我也在试图优化成本,看看能否以更低的价格获得类似的质量。到目前为止我所做的是:
* 将大部分编码工作转移到GPT-5.5,使用200美元的OpenAI计划
* 对于编码来说,效果很好
* 我也试过DeepSeek V4 Pro,但感觉速度太慢
* GPT-5.5也比Sonnet/Opus稍慢,但打开多个标签页时也还可以接受
现在我正在考虑更多地转向Codex/GPT,以减少Anthropic API的成本并从200美元计划中获得更多价值。但我一直听说Codex/GPT在以下方面表现不佳:
* 回复客户邮件
* 撰写知识库文章
* 处理员工规划/运营
* 一般商业沟通
而且Anthropic模型(尤其是Sonnet/Opus)在这些任务上仍然更好。
所以我想知道其他人是怎么做的:
* 你现在把所有任务都放在Codex/GPT上吗?
* 还是你仍然用Anthropic处理写作/商业任务,而Codex主要用于开发?
* 有没有推荐的设置/工作流/模型来优化质量与成本?
很想听听其他人是如何构建他们的技术栈的。
相似文章
GPT-5.5 或许消耗更少的 token,但它始终烧掉更多的钱
尽管 OpenAI 声称 GPT-5.5 在 token 效率上有所提升,但实际使用成本仍比 GPT-5.4 高出 49% 至 92%;与此同时,Anthropic 的 Claude Opus 4.7 对于较长提示词的实际成本也上涨了 12% 至 27%。这一现象反映出前沿模型价格普遍上涨的趋势,而两家公司均面临巨额预计亏损。
@philipkiely: 关于示例工作负载:Opus 4.8 -> Kimi 2.7 Code | 节省82% GPT 5.5 -> GLM 5.2 | 节省77% Gemini 3.5 Flash -> Nemot…
菲利普·基利(Philip Kiely)的一条推文强调,使用Baseten的ROI计算器工具,从闭源AI模型切换到开源替代方案可节省成本。
Claude Code 与 Codex 对比
用户希望比较 Claude Code 和 OpenAI Codex $20 订阅方案的价值,并分享了自己涉及 Haiku、Sonnet、Qwen 和 DeepSeek 的个人工作流。
@orca_build: Anthropic的新款Opus 4.8在Terminal-Bench 2.1上的得分比GPT 5.5低3.6%……但在UI任务上明显更出色。
Anthropic的Opus 4.8在Terminal-Bench 2.1上比GPT 5.5低3.6%,但擅长UI任务;Orca的编排功能让Codex能将UI任务委托给Claude Code。
@doublenickk: > 20个免费日额度可覆盖GPT 5.5或GLM的一次完整工作会话 > Opus 4.7可处理2-3个严肃架构任务…
一条推文强调,Tembo提供的20个免费日额度可完全访问GPT 5.5和GLM,而Opus 4.7可以零成本处理架构任务,其输出与付费工具相当。