@yibie: 30 天 360 个 PR、不会写代码、不看 Plan:Matt Van Horn 的 Agent Loop 是怎么设计的 上个月,一个叫 Matt Van Horn 的人引起了我的注意。 • 没有 CS 学位 • 不会写代码 • 不看 …
摘要
文章介绍了Matt Van Horn如何通过设计Agent循环而非编写prompt,在30天内实现360个PR合并,并详细拆解了其三个工具和8条LAW规则,强调从prompt writer到loop designer的转变。
查看缓存全文
缓存时间: 2026/06/18 22:22
30 天 360 个 PR、不会写代码、不看 Plan:Matt Van Horn 的 Agent Loop 是怎么设计的
上个月,一个叫 Matt Van Horn 的人引起了我的注意。
• 没有 CS 学位 • 不会写代码 • 不看 AI 写的 plan
但过去 30 天,他在 GitHub 上合入了 360 个 PR,横跨 40 个仓库,平均每天 12 个。
他做的 last30days 达到 30,000+ GitHub stars,一度 #1 trending。Printing Press 发布的推文 3,447 赞。Agent Cookie 522 stars。
他怎么做到的?答案是一句话:停止 prompt Agent,开始设计循环让 Agent 自己 prompt 自己。
一句话判断
Matt Van Horn 不是在写代码。他把“自己 prompt Agent 做事“这件事本身变成了一个循环。他设计的是 Agent 的操作系统,而不是 Agent 的指令。 这跟 Tibo 让 Codex 支持任何模型是同一个逻辑:不是在卷 prompt 质量,是在卷 Agent 运行时的质量。
三个项目,一个方法论
Matt 做了三个工具,恰好覆盖了一个 Agent Loop 的三层:
| 层 | 项目 | 做什么 | Stars |
|---|---|---|---|
| 感知 | last30days | 多源社交媒体搜索,13 个平台并行,告诉 Agent 外部的讨论是什么 | 30K+ |
| 执行 | Printing Press | CLI 工厂,把任何 API 变成 Agent 能高效调用的工具接口 | 3.4K 赞 |
| 基础设施 | Agent Cookie | 跨机器浏览器会话同步,让 Agent 永远保持登录 | 522 |
三层的关系:last30days 告诉 loop 该做什么 → Printing Press 给 loop 提供执行的工具 → Agent Cookie 让 loop 在无人值守的机器上持续跑。
本质上,这就是一个 Agent OS 的雏形。
怎么设计 loop?拆解 last30days 的 1400 行 SKILL.md
last30days 不是一个“工具“。它是 Matt 对“Agent Loop 怎么设计“这件事的最完整表达。
它的架构分两层: • Python 引擎:负责机械工作——并行搜索 13 个平台、按 engagement 排序、跨源聚类合并、去噪。它是“肌肉“。 • 1400 行 SKILL.md:负责判断工作——怎么解读结果、怎么合成输出、什么格式才是对的。它是“大脑“。
关键设计:用 8 条 LAW 约束 LLM
SKILL.md 不是文档。它是用自然语言写的有限状态机。核心是 8 条 LAW,每条都有“named failure mode“:
| LAW | 约束内容 | 对应回归 |
|---|---|---|
| LAW 1 | 禁止末尾输出 Sources 段 | Peter Steinberger disaster #3 |
| LAW 2 | 禁止发明标题 | v3.0.6 0/8 public regression |
| LAW 3 | 禁止 em-dash | 通用 AI-slop tell |
| LAW 4 | 禁止 ## 段落标题 | Peter Steinberger disaster #2 |
| LAW 6 | 禁止直接输出 raw evidence | Hermes 2026-04-19 disaster |
每一条 LAW 背后都是一个具体的、可命名的失败案例。 这跟软件团队的 postmortem 逻辑完全一样——bug 被发现 → 起名字 → 加规则 → 验证。
loop 流程:从 raw topic 到最终输出
输入 “Kanye West” ↓ STEP 0: 引擎自检(你读的是最新版 SKILL.md 还是 stale clone?) ↓ STEP 0.45: query 质量检查(“给 42 岁男人的礼物” → reframe,这种词没人发) ↓ STEP 0.55: 解析实体 → @kanyewest + r/Kanye + GitHub 关联 ↓ STEP 0.75: LLM 生成 JSON query plan(搜索策略、权重分配) ↓ STEP 1: Python 引擎并行搜索 13 个源 → 按 engagement 排序 → 跨源聚类 ↓ STEP 2: LLM 补充 WebSearch 填补博客/新闻空白 ↓ Judge: LLM 按 8 条 LAW 合成最终输出 ↓ 反馈闭环: 每个回归都有名字 → 下次循环修复
这个流程的厉害之处不在于任何一个单独的步骤,而在于“代码 + 自然语言契约“的混合体。 代码做机械的搜索排序,LLM 做需要判断的合成。两者之间的接口就是 SKILL.md。
停止 prompt Agent,开始设计 loop——这意味着什么
Matt 在 6 月 3 日的推文中总结了他的 20 条方法论:
- 有想法 → /ce-plan 生成 plan(不自己读,plan 是给 Agent 的)
- 模糊的想法先 /ce-brainstorm
- Make the plan, don’t read it
- 用语音,不打字
- 跑 4-6 个 tab 并行任务
- 不给 Agent 设权限限制(YOLO)
- 你是品味,Agent 是手
- 任何事做两次 → 写一个 skill
- 永远不关机的笔记本
- 跑 last30days 再做 plan
这 20 条的核心只有一句话:你不再是一个 prompt writer。你是一个 loop designer。
过去的 workflow:人有想法 → 人写 prompt → Agent 执行 → 人看结果 → 人写下一个 prompt 现在的 workflow:人有想法 → loop 读取信号 → loop 生成 prompt → Agent 执行 → loop 检查结果 → loop 决定下一步
人从操作者变成了监督者。
对内容工作室的实际意义
回到我们的场景:做选题、侦察、创作的整个过程,其实也可以设计成 loop:
- 感知层:定时任务触发 → agent_search + last30days 并行拉素材
- 执行层:LLM 打分推荐 → 生成草稿 → 人去审查、调整品味
- 基础设施层:所有流程写进 skill,重复两次就固化
Matt 做 last30days 的本质,就是把“手动搜 Reddit + X + YouTube“这件事变成了一个 loop。我们做内容工作室的本质,就是把手动搜素材、写草稿、发布这件事,逐步变成一个个 loop。
今天的 prompt engineering 只是这一步的演练。真正的复利在于:你每写一个 skill,loop 的自动化就深一层。
#AI工程 #AgentLoop #AgenticEngineering #开源
相似文章
@cxjwin: 发现一个很实用的网站,专门收集各种现成的 Agent Loop 模板。 核心理念就是:别再一直手动 prompt 了,设计好 loop 让 agent 自己跑完任务。 里面有 Test Until Green、Fix CI Until G…
分享了一个收集现成 Agent Loop 模板的实用网站,核心理念是让 AI agent 自动完成任务,包含 Test Until Green 等常用 loop,适合配合 Claude Code 和 Cursor 使用。
@cellinlab: Loop Engineering 正在取代“你亲自给 agent 写 prompt”这件事。 它的核心是:你不再直接 prompt agent,而是设计一个系统,让这个系统去 prompt agent。
Loop Engineering 正在取代直接为 agent 写 prompt 的方式,核心是设计一个系统来为 agent 编写 prompt。
@cellinlab: https://x.com/cellinlab/status/2064144608242679822
这篇文章介绍了 Loop Engineering 的概念——不再直接给 AI agent 写 prompt,而是设计一个系统(loop)来递归地让 agent 迭代工作,直到任务完成。文章详细对比了 Claude Code 和 Codex 在 automations、worktrees、skills、sub-agents 等五个构建块上的实现,认为这可能是未来与 coding agent 协作的趋势,但仍需警惕 token 成本和 AI slop 问题。
@li9292: 我推荐这个网址: https://loops.elorm.xyz 收录了几十个大神的 loop engineering的思路
一个精心整理的预构建代理循环(闭环工作流)集合,适用于 Claude Code 和 Cursor 等编码代理,包含触发器、反馈门控以及用于自主任务执行的退出条件。
@uniswap12: Claude Code 用到这个程度,我算是开眼了 Matt Van Horn 最近写了一篇长文,把他用 Claude Code 的所有技巧和工作流全盘托出了。这篇文章在开发者社区引起了不小的反响,因为他展示的东西已经远远超出了“用 AI…
Matt Van Horn 分享了使用 Claude Code 的高级工作流:先通过 plan.md 进行详细规划,再用语音输入和多窗口并行执行任务,展示了如何将 AI 深度融入开发流程,大幅提升效率。