@wei_wang: https://x.com/wei_wang/status/2072878140490231882
摘要
本文介绍如何使用 Hermes Desktop 桌面应用,将 ChatGPT、X Premium/Grok、DeepSeek、MiniMax 等多个 AI 模型集成到一个应用中,并通过配置消息通道和自动化工作流,实现不同任务分配给不同模型,提高效率。
查看缓存全文
缓存时间: 2026/07/03 12:37
你付的 ChatGPT、X Premium、DeepSeek、GLM 和 MiniMax,其实能接进同一个 app 一起干活
你可能已经同时付着好几份 AI 的钱:ChatGPT 的订阅、X 的 Premium、DeepSeek 充的额度。但用的时候还是开四个网页,切来切去,各聊各的。
这篇教你把它们全接进一个桌面 app:Hermes Desktop。接完之后,搜索交给 Grok、日常琐事交给最便宜的 DeepSeek、写代码交给 ChatGPT,再让它 24 小时挂着,每天早上自动推简报到你手机、帮你盯着想盯的账号。
我自己整套配完没花到一个小时。不用写代码,不用碰终端,不用在四个 app 之间来回切,新手跟着走一遍就行。
这篇四部分:装 app 5 分钟,接模型10分钟,接消息 10 分钟,10 个工作流照抄,外加一个选配的组合技。只想解决某一件事,直接跳到对应那节。
这套的思路:不同活给不同模型
不同模型干不同活:搜索给擅长搜索的、写代码给擅长代码的、日常琐事给便宜的。以前做到这件事要自己写脚本、管一堆 API Key。Hermes 桌面版把它变成了点鼠标:图形界面里管供应商、模型、技能,跟命令行版共用同一套配置,但你不用碰终端。
第一步:装 Hermes Desktop(纯点鼠标)
打开官网 hermes-agent.nousresearch.com,点 Install,选你的平台(Windows / Mac / Linux 都有),下载安装包,双击装。
⚠️ 网上搜“hermes desktop”会跳出好几个长得很像的第三方仓库,只认 hermes-agent.nousresearch.com 这个官方域名,别的不要装。
装完打开,第一次启动是一个引导页(Let’s get you setup with Hermes Agent),下面列着一排模型供应商,大部分点一下就能连,咱们下一步就在这个页面上干活。手快跳过了(I’ll choose a provider later)也没关系:设置里的 Providers 面板随时能加,入口一般在左下角或顶部菜单栏,图标是齿轮,找不到就试快捷键 Cmd+,(Windows 是 Ctrl+,)。
第二步:接 4 个模型
好消息:四个里有三个是一键登录。在引导页或 Providers 面板里点它,浏览器自动打开验证页,登录你的账号,回来就连上了,全程不碰 API key。
① Grok(搜索担当):点 xAI Grok,浏览器跳 accounts.x.ai 授权,不用申请 API Key。它最拿手的是 X(推特)实时搜索,Hermes 一大半价值靠这个。两个坑:默认模型现在是 grok-build-0.1,不是老教程写的 grok-4.3(仍可手动选);另外有个写这篇时还没修复的 bug,一部分标准 SuperGrok($30/月)用户登录后请求会被打回 403 报没权限。我自己用的是 X Premium+ 订阅走 OAuth,没碰上这个问题。真撞上了就改用手动填 XAI_API_KEY 这条路,别以为是自己操作错了。
② DeepSeek V4(日常担当,最省钱):先去 platform.deepseek.com 注册,左边 API Keys 里创建一个 Key,它只显示一次,当场复制;充 10 块钱人民币,日常用很久。回到 Providers 面板找到 DeepSeek,把 Key 粘进去,模型名填 deepseek-v4-flash(便宜快)或 deepseek-v4-pro(推理强)。注意用新名,旧名 deepseek-chat / deepseek-reasoner 2026 年 7 月 24 日停用,照抄老教程会踩空。
③ ChatGPT(写代码担当,两条路别搞混):路径 A 是填 OPENAI_API_KEY,拿到 GPT 系聊天模型,按量付费;路径 B 是点 OpenAI OAuth(ChatGPT),用 ChatGPT 订阅账号一键登录,不用 Key、走订阅额度,但拿到的是 Codex 系编程模型,不能当聊天模型使。这套分工里 ChatGPT 的活就是写代码,对应路径 B:付着订阅的人等于白捡一个编程模型。
④ MiniMax M3(我自己在付的订阅):跟 Grok 一个待遇,官方一键支持:点 MiniMax,浏览器打开验证页,登录你的 MiniMax 账号,自动连接,不用碰 API key。手里只有 API key 没有订阅的,用引导页右下角 I have an API key 入口填也行。
接完之后怎么用:输入框旁边有个模型选择器,点开就能换当前这条对话用哪个模型;要搜 X 的时候切 Grok,日常琐事切 DeepSeek,写代码切 Codex。设置里还能定一个全局默认,建议设成 DeepSeek:新对话、后台任务默认都走最便宜的,要好货再手动切。
我自己 4 个都接完了,很快,没有哪一步卡住超过几分钟。
第三步:接消息通道,让它随叫随到
配好模型只是能在电脑上聊。接上消息软件,它才变成一个“随叫随到的助手”:手机上发句话就能派活,定时任务的结果也直接推给你。
我自己配的是 Discord 和 Telegram:
-
Telegram(最简单,推荐先配这个):
-
在 Telegram 里搜 @BotFather,给它发 /newbot,按提示给你的机器人起个名字;
-
它会回你一串 Bot Token,当场复制;
-
回到 Hermes 的 Messaging 设置,选 Telegram,把 Token 粘进去保存;
-
回 Telegram 给你的机器人发一句“在吗”,它回了就是通了;没回的话去 Hermes 里看有没有待批准的配对提示,批一下就好。
⚠️ 一个坑:Telegram bot 的 Privacy Mode 默认开启,拉进群里会看不到普通消息,要在 BotFather 里手动关掉再重新拉群。
- Discord:在 Discord 开发者后台建应用、拿 Bot Token、生成邀请链接,步骤多几步。⚠️ 最大的坑:Privileged Gateway Intents 不打开,bot 收到的全是空消息,官方文档原话说这是“Discord bot 不工作的头号原因”。
配好后在你想收推送的频道里发一句 /sethome,之后所有定时任务的结果都投到这里。30 秒,但很关键。
在国内不方便用这两个的,可以考虑配飞书:Hermes 支持扫码自动创建飞书应用,不用手动去开发者后台折腾。
第四步(选配):MoA,难题才开的组合技
Hermes 里还有个功能叫 Mixture of Agents:一次提问,几个模型并行给意见,再由一个模型汇总出最终回答,相当于开个小会。设置里 Model 部分能配,配好的组合会像普通模型一样出现在下拉菜单里。更省心的用法是一次性调用:对话里打 /moa 加你的问题,这一条用组合回答,答完自动恢复你原来的单模型。
配组合时有个省钱思路,跟官方默认配置一致:给意见的模型用你已经付费订阅的(边际成本约等于零),只有最后做汇总的模型用贵的。
我自己开过一次:让它把我本地的 Amazon 运营系统整体评估了一遍,正是这种“交给一个模型不放心”的把关活,几个模型互相挑毛病是真有用。花的全在订阅额度以内,没有额外掏一分钱;速度上它要等几个模型都跑完,这种长任务本来就要等,感知不强。
什么时候开:要交付给客户不能错的东西、代码 review、架构决策。日常琐事别开,它比单模型慢不少,单模型又快又够用。我的用法就一句:难题才开。
装完之后:10 个照抄就能跑的工作流
我自己天天跑的就四件事:抓热推、盯对标账号、找选题缺口、复盘自己的数据。下面前 4 个就是这四件事的自动化版,后面 6 个覆盖写内容、接单、过日子的高频场景。全都不用写代码:直接在对话框里把要求说清楚,Hermes 自己会把它变成定时任务,或者当场干活。
① 每日简报(10 分钟跑通,最适合第一个配)
先在对话里手动测一句“搜索 AI agent 最新新闻,总结 top 3 并附链接”,跑通了就直接说人话建任务:
它自己会把这句话变成定时任务。想精确控制就用 /cron add “0 8 * * *” “…”。这个活便宜模型就够:建任务前先把当前模型切到 DeepSeek 再说这句话(任务会记住建它时用的模型),别烧贵的。
② 扔链接即总结(内容创作者的选题挖掘器)
往 Telegram 里粘一个 YouTube 链接或文章 URL,后面跟一句话就行:
内置技能 youtube-content 会把字幕直接扒下来处理。看到别人的爆款视频,一分钟拿到它的骨架。
③ 盯对标账号(用 Grok 拉 X 数据,不另花一分 API 钱)
这活正好用上第二步接的 Grok:Hermes 拉 X(推特)数据走的是你已经在付的 X Premium+ / SuperGrok 订阅,不用再单独去申请 X 的开发者 API(那个要另花钱)。直接在对话里说:
对标如果还有博客或 newsletter,内置的 blogwatcher 技能可以盯 RSS,一样一句话挂上。
④ 每周数据复盘
同样直接在对话里说:
把“复盘”从靠自觉变成自动送上门。
⑤ 文风替身(喂它你的旧推文,让它学会像你)
生成的东西一股 AI 味,是因为它不认识你。把你写过表现最好的内容喂给它:
关键在最后一句:让它自己交代“哪里最像 AI”,你只改那两句,比整篇重写省十倍力气。
⑥ 发文前找茬(发出去之前先被骂一遍)
AI 默认顺着你说,夸你的稿子毫无价值。发文前把草稿丢给它,换个指令:
被它骂完再发,评论区能少挨很多真骂。
⑦ 收藏夹考古(把吃灰的收藏变成选题)
每个人都有个“回头再看”的坟场:收藏的推、存的链接、截的图。全部甩给它:
收藏不等于读过,读过不等于能用。这一步把“攒”变成“产”。
⑧ 见客户前的功课(接单人的会前简报)
跟客户开会前,把对方甩给它:
会前 5 分钟看一张卡,比现场“您贵公司是做什么的”体面太多。
⑨ 盯你在等的任何东西(降价、补货、开放报名)
在等一个降价、一次补货、一个报名通道开放?别自己天天刷:
同一招能盯竞品的定价页、政策页面、演唱会票,什么都行。
⑩ 语音速记变待办(纯属白送)
对着 Telegram bot 发语音,自动转文字;Mac 用户接一句“存进提醒事项”,走路时说句话就变成了待办。
三条铁律,不知道必翻车:
-
定时任务要 24 小时活着,得让 Hermes 常驻后台。桌面 app 里开启 gateway 常驻(或按官方文档装成系统服务),不开的话你关掉窗口,所有定时任务全部停摆。自检方法:建完第一个定时任务后把窗口关掉,到点看手机收没收到推送;没收到就是常驻没开成,回设置打开,或者用最笨的办法:让 app 一直开着。
-
每个定时任务都是全新会话,没有记忆。要求必须全部写进任务描述里:搜什么、什么格式、推到哪,一句都不能省,别指望它“记得上次说过”。
-
监控类必加 [SILENT]。凡是“有更新才需要告诉我”的任务(比如盯博客 RSS),指令里必须加一句“没有更新就只回 [SILENT]”,这是官方的静默标记,不加的话它每小时都给你发一条“没有新内容”,半夜刷屏。
坑清单,一次列全
-
仿冒仓库:只信官方两个域名。
-
想一次配齐再开始用:别。先跑通一个模型(建议 DeepSeek,最简单),再加下一个。
-
ChatGPT 两条路径搞混:路径 B(订阅登录)只给编程模型,不能聊天。
-
Telegram 群里 bot 装聋:Privacy Mode 默认开着,去 BotFather 关掉再重新拉群。
-
Discord bot 收到空消息:开发者后台把 Privileged Gateway Intents 打开。
-
MoA 设成了默认模型:每条消息都变慢、多烧额度。/moa 按需用。
配完之后
这套配置我自己全程跑完了:4 个模型、加上 Discord 和 Telegram,整套下来没花到一个小时。现在搜索、日常、写码各有各的模型,早上简报自动送到手机,盯的账号一有动静就收到摘要。
谁干什么活、什么时候值得多花一点、什么时候用最便宜的,都是自己说了算。工具越强,这种“自己说了算”越值钱。
相似文章
@VincentLogic: 发现个挺有意思的 AI 助手客户端! Hermes Agent,界面做得挺清爽的中文桌面应用。功能集成得挺全: - 对话、会话管理 - 多模型支持 - 技能、工具集成 - 定时任务、网关配置 从界面看能帮你:搜索网页、设置提醒、总结邮件、…
Hermes Agent 是一款基于 Electron 开发的跨平台 AI 助手桌面客户端,支持多模型切换、技能集成与定时任务等功能,旨在为用户提供统一的 AI 效率工作台。
@Lonely__MH: https://x.com/Lonely__MH/status/2055156505796866407
这篇文章分享了七个配置 Hermes AI agent 的技巧,包括设置灵魂、记忆系统、技能固化、定时任务、辅助模型、多平台网关和手机控制,并介绍了如何免费使用 Nous Research 提供的模型。
@FakeMaidenMaker: Hermes Agent 终于有了桌面应用啦! 想用 Hermes Agent,都要打开 terminal 配 provider、装 skill、改 cron 都得敲命令,光看 ~/.hermes 那堆 yaml 和 env 文件就头大。…
Hermes Desktop 是 Hermes Agent 的桌面 GUI 伴侣,提供图形化安装、配置和聊天功能,支持 11 个 LLM provider 和 16 个消息平台,简化了 CLI 操作。
@NFTCPS: Hermes 这波直接把 Agent 天花板给掀了! 全网程序员已经开始用它搭桌面神器、跑创意流水线、省 token 省到飞起——你还没跟上? 先说 hermes-desktop,CLI 小玩具直接进化成 Mac/Windows 原生桌面…
本文介绍了围绕Hermes Agent构建的五个开源工具项目,包括桌面应用、创意工作流、共享记忆层、token压缩工具和监控仪表板,旨在扩展Agent的生态系统。
@ChrisWangwy: https://x.com/ChrisWangwy/status/2057406034973733234
讨论了如何通过显式沉淀(AGENTS.md、Skill)和隐式积累(记忆、session search)让Hermes AI助手避免每次冷启动,从而真正成为个人系统,并引用GBrain作为个人知识基座的旁证。