运行三小时后自说自话的代理需要的不是一个框架,而是一个文件

Reddit r/AI_Agents 工具

摘要

分享了一个 CLAUDE.md 文件,用于修复长时间运行但只会空谈不交付工作的编码代理。它强调行动胜于叙述,并能跨模型使用。

花了很多时间观察 claude code 和 kimi 的会话,发现它们都朝着同一个方向漂移: > 我应该先检查测试输出再继续。 > 让我想想最佳方法。 > 实际上,我应该先验证状态。 > 下一步应该是更新配置。 说了很多话,零交付工作。代理本身没问题,缺少的是操作契约。 发布了一个小型的公开 CLAUDE.md 文件,专门解决长时间运行的编码代理的这个问题。一个文件,没有框架,复制到你的仓库中,然后告诉代理遵循它。重点放在行动而非叙述、实时证据而非陈旧记忆、紧凑的会话状态、重启后的恢复以及不会成为牢笼的安全检查上。在公开发布之前,已经在私有部署中积累了超过 1600 小时的长时间会话。在 claude opus 4.6 和 kimi k2 上的工作方式相同。采用 MIT 许可证。 如果你在克隆任何东西之前想感受一下行动胜过叙述的转变,仓库里有一个 60 秒的纯提示演示。将提示粘贴到任意有能力的模型中,给它一个真实任务,看看区别。你有没有遇到过代理长时间会话中最烂的那种腐败?好奇操作契约的框架是否与你所见的一致,还是你遇到的腐败看起来不一样。(根据子版块规则,仓库链接见顶部评论。)
查看原文

相似文章