@ChrisWangwy: https://x.com/ChrisWangwy/status/2057406034973733234

X AI KOLs Timeline 工具

摘要

讨论了如何通过显式沉淀(AGENTS.md、Skill)和隐式积累(记忆、session search)让Hermes AI助手避免每次冷启动,从而真正成为个人系统,并引用GBrain作为个人知识基座的旁证。

https://t.co/kVnZHps1Ft
查看原文
查看缓存全文

缓存时间: 2026/05/21 15:45

Hermes 用了三个月,你还在重新介绍自己吗

很多人用了 Hermes 一段时间,仍然觉得它没有更懂自己。问题未必在模型,而在经验没有被留下。读完这篇,至少能判断一件事:该把哪些东西写进项目、Skill 和记忆,别再让每次对话都冷启动。

我认识的人里,真正把 Hermes 用满三个月的,一只手就够数。更多人是装好、接上模型、问了几句,觉得还行,便把它丢在后台。隔几天想起来,又打开问一句;再隔几天,还是从头说自己在做什么项目、目录在哪里、偏好什么口吻、上一次卡在什么地方。这当然也能用,只是这样用三个月,Hermes 和人的关系没有发生什么变化。它每一次回答,都像第一天安装时那样冷启动。

入口没有留好,三个月也只是重复冷启动

这大概算一种沉默的浪费。因为 Hermes 值钱的地方,未必在某一次回答多么聪明;模型今天强一点,明天还会有更强的。真正能留在本地的,是它在日常使用中把有效交互沉淀下来,把人反复教过它的经验变成可复用的能力。用一位熟人的说法,花了三个月跟它对话,到头来它对使用者的了解还不如一个刚认识两周的同事,这当然不能全怪 Hermes。

入口本来就没有留好。

显式沉淀:把反复教它的话写进系统

我后来才把这件事想明白。Hermes 的积累大体有两类,一类是显式的,一类是隐式的。显式的那类最好理解,项目怎么跑,写进 AGENTS.md;希望它用什么口吻,写进 SOUL.md;某种任务每周都要做,例如汇总飞书会议纪要、把 X 上的消息转成选题简报、文章写完以后查一遍 AI 痕迹,那就做成 Skill。不用每次都在对话框里念一遍「先 cd 到 backend,跑 pnpm install,再……」。这种话说到第三遍,已经该写进文件;说到第二十遍,只能说明人比机器更健忘。

显式沉淀和隐式积累,是 Hermes 越用越顺手的两条路。

我自己的 wenyuan 配置里,现在挂着 195 个 Skill。写文章、管飞书、做视频、查论文、处理图片、跑发布流水线,都有对应的操作手册和禁忌。它们不是某一天坐下来大兴土木写成的,也不是为了显得工具箱漂亮才堆在那里。三个月里,每踩一次坑,每发现一个流程会反复出现,每被纠正一次「下次不要这样做」,我就把那一小段经验塞进 Skill 或项目文件。它的好处很朴素,下一次不用重新教。

隐式积累:旧对话不该在结束时蒸发

隐式的那类更容易被低估。Hermes 的长期记忆、USER.mdMEMORY.mdsessionsearch、/save 这些东西,听起来像一堆零散功能,实际承担的是另一件事。一个人用过什么命令,改过什么文件,讨论过什么方案,纠正过它哪一种错误回答,甚至随口说过自己讨厌哪种标题和结尾,这些信息不该在会话结束时全都蒸发。尤其是 sessionsearch,它不像普通聊天记录那样躺在历史列表里等人翻,它可以在需要的时候把旧对话里那段真正有用的东西捞出来。

这一路没有 Skill 那么精确,也没有 AGENTS.md 那么可控;但它会在长时间里改变第一轮对话的质量。三个月以后,在同一个项目里只说半句话,它就知道上次做到哪里,大概不想要什么,哪些命令在机器上已经跑通过,哪些 provider 因为没 key 或权限失败过。它给出的第一版建议会变短,也会变准。少说几句废话,有时就是质变。

真正省下来的不是时间,是脑子

我自己经历过那种「每次都重新开始」的阶段。同一个内容生产项目,我反复告诉 Hermes,项目路径在固定的内容生产目录,文章有 brief、draft、final、配图、发布物几个阶段,某些检测步骤暂停,不要去打开旧页面,公众号和 X 的图片比例不要乱用。这样的话说一遍无妨,说二十遍就很可笑了。后来我把它写进 AGENTS.md 和项目上下文文件,每次在那个目录里启动,背景自动进来,第一条消息不用再铺垫半页纸。

三个月后的差距,往往不是回答长度,而是冷启动成

省下来的不是十几秒。省下的是脑子。

GBrain 旁证:agent 身后需要知识基座

多数人对这种损耗不敏感,因为每一次重新解释都太小了。重复一句项目路径,不会让人立刻感到痛苦;多贴一段背景,也不至于让人觉得工作方式出了问题。可到了第三个月,项目复杂度上来,上下文变多,协作对象变多,旧决策也变多,那个一直冷启动的 Hermes,就会逼着使用者每次在开头重新装配一次自己。而已经把项目、偏好、流程、失败经验沉淀下来的人,打开它时面对的就不是一个问答框,倒更像面对一个已经在办公室里待了三个月的助手。

个人知识基座越清楚,agent 第一次回答就越接近真实需求。

这个差距,外部也有人在用另一种方式验证。YC 总裁 Garry Tan 开源的 GBrain,在 GitHub 上拿到了一万六千多星,做法很直白,把邮件、日历、会议记录、推文、个人笔记、聊天记录这些东西都存成 Markdown,再用 Postgres 和 pgvector 做混合检索,让 AI agent 回答前先读相关背景。他一星期攒了一万多个 Markdown 文件、三千多个人物档案、十三年的日历数据和两百八十多份会议记录;GBrain 在 LongMemEval 这类长期记忆评测里给出过 97.6% 的召回率。这个数字当然不等于每个人都该照抄他的系统,但它证明了一件很实际的事,agent 的能力很大一部分取决于它身后有没有可检索的个人知识基座。

Hermes 和 GBrain 不是同一个东西,我也不想把二者强行说成一套方案。GBrain 更像一个围绕个人档案建起来的检索系统;Hermes 对普通用户更有用的地方,在于它把工作目录、Skill、记忆、会话搜索这些东西放到了日常操作里。不必先设计一个宏大的个人知识库,只要在每次用完以后多做一点沉淀,把下次会重复的话写进该写的地方,系统就开始长出来。

判断一个 Hermes 用户有没有真正用起来

这件事听上去不性感。它不像换一个更贵的模型那么立竿见影,也不像装一个新插件那样让人有新鲜感。写 AGENTS.md、整理 Skill、保存会话片段、给记忆纠错,都是小动作,琐碎得很。可一个人真正的工作能力,本来也不是靠某次灵光一现支撑的,乃是靠大量琐碎判断的复用。助手也是如此。

所以我现在看一个 Hermes 用户有没有真正用起来,不看他有没有追最新模型,也不看他能不能说出十个斜杠命令。我会先看他的项目目录里有没有 AGENTS.md,看他有没有把反复做的流程做成 Skill,看他的记忆里有没有经过纠正的个人偏好,看他遇到旧问题时会不会先翻 session_search。若这些都没有,他用的就仍然是一个每次都被临时雇来的答题者,聪明归聪明,散场就散了。

这也解释了为什么有人用了 Hermes 一阵子,仍然觉得它「好像没变得更懂我」。这个感受多半是真的。模型不够强、功能不够多,都不是根本原因;问题在有效经验没有留下来。问答结束,经验也结束;下次再问,照旧从头开始。它当然不会突然变成你的搭档。

今天能改的事情很小。把每次开头都要交代的项目背景写进 AGENTS.md,把每周重复的任务抽成一个 Skill,把一段值得复用的对话用 /save 留住,隔一阵子用 session_search 翻一翻过去怎么解决同类问题。做完这些,Hermes 未必马上显得更神奇,但三个月以后,人会少说很多废话。

我宁愿把这看作一种判断标准。一个工具能不能长期留在工作流里,不看它第一天让人惊艳了几次,要看它三个月后还能不能接住旧经验。接不住,它就是一个聪明的临时工;接得住,它才算开始变成一个人的系统。

相似文章

@Lonely__MH: https://x.com/Lonely__MH/status/2055156505796866407

X AI KOLs Timeline

这篇文章分享了七个配置 Hermes AI agent 的技巧,包括设置灵魂、记忆系统、技能固化、定时任务、辅助模型、多平台网关和手机控制,并介绍了如何免费使用 Nous Research 提供的模型。

@GitTrend0x: Hermes 继续自进化冲超级体! Humanizer 去 AI 痕迹、Obsidian 身份层、Taste 风格记忆、AutoShorts 短视频工厂、Creative Brain 采访大脑……全网程序员把 Hermes 玩成了下一代 …

X AI KOLs Timeline

介绍了一系列与Hermes agent相关的开源技能:humanizer去除AI痕迹、obsidian-skills将笔记变为身份层、taste-skill提炼个人风格、skill-autoshorts自动剪辑短视频、creative-brain采访提炼创意风格,旨在将Agent变为真人写手和私人知识库。