@itsolelehmann: 按价格层级划分的 Hermes 最佳模型配置：1. 预算无限时：选用 GPT 5.5 或 Claude Opus …

X AI KOLs Following 2026/05/11 16:08 新闻

摘要

本文介绍了 Hermes 应用中按预算层级划分的 AI 模型配置，推荐预算无限时使用 GPT 5.5 和 Claude Opus 4.7 等高端方案，预算有限时使用 DeepSeek V4 Flash 等经济高效的备选方案，并可通过 Qwen 3.6 进行本地部署，实现零推理成本。

运行 Hermes 的最佳模型配置（按价格层级）：1. 如果预算无限：选择 GPT 5.5 或 Claude Opus 4.7。两者都是顶级水平，在任何非简单任务中都能感受到差距。我使用 GPT 5.5 是因为它支持 Codex 登录。它会登录到你实际的 ChatGPT 账户，因此使用量计入你现有的订阅（无需单独支付 API 费用）。Anthropic 对 Claude 不允许同样的操作，因此如果选择 Opus 4.7，你需要在已有的 Claude 费用之外额外支付高额 API 费用。在 OpenAI $120/月及以上的套餐中，正常工作日基本不会触及速率限制。2. 如果预算较紧：以 DeepSeek V4 Flash 作为备选方案运行 GPT 5.5，当你用完 $20/月 ChatGPT 额度时切换。如果宁愿完全不触及限制，可以将主模型从 GPT 5.5 换为 GPT 5.4 mini。或者完全跳过 ChatGPT，仅使用 DeepSeek V4 Flash，典型月份的费用可控制在 $30 以下。3. 如果拥有性能强劲的本地机器：Qwen 3.6 是最佳配置。运行后零按 Token 计费，代码永不出本地。选择与你月度支出相匹配的方案，从那里开始。还有什么遗漏 / 你还会推荐其他设置吗？

查看原文

@itsolelehmann: 按价格层级划分的 Hermes 最佳模型配置：1. 预算无限时：选用 GPT 5.5 或 Claude Opus …

相似文章

@svpino：在本地电脑上跑 Hermes 微调版 Gemma 4 或 Qwen 3.5，简直是最佳组合，不试真的会后悔……

我停止打造一家AI优先的公司。正确的Hermes设置应该是什么样子

当我让每个配置都像资深工程师一样思考时，Hermes 变得昂贵了。

@theemozilla: 我们正在努力改善 Hermes 中的本地模型体验，每个参数量级的最佳本地模型是什么？

@sudoingX：这台笔记本通过 Hermes agent 以 99% GPU 利用率本地跑 31B 模型，持续 15 tok/s，22.8 o…

提交意见反馈