@yibie: 30 天 360 个 PR、不会写代码、不看 Plan：Matt Van Horn 的 Agent Loop 是怎么设计的上个月，一个叫 Matt Van Horn 的人引起了我的注意。 • 没有 CS 学位 • 不会写代码 • 不看 …

X AI KOLs Timeline 2026/06/18 07:28 新闻

ai-agent agent-loop engineering-methodology open-source github prompt-engineering automation

摘要

文章介绍了Matt Van Horn如何通过设计Agent循环而非编写prompt，在30天内实现360个PR合并，并详细拆解了其三个工具和8条LAW规则，强调从prompt writer到loop designer的转变。

30 天 360 个 PR、不会写代码、不看 Plan：Matt Van Horn 的 Agent Loop 是怎么设计的上个月，一个叫 Matt Van Horn 的人引起了我的注意。 • 没有 CS 学位 • 不会写代码 • 不看 AI 写的 plan 但过去 30 天，他在 GitHub 上合入了 360 个 PR，横跨 40 个仓库，平均每天 12 个。他做的 last30days 达到 30,000+ GitHub stars，一度 #1 trending。Printing Press 发布的推文 3,447 赞。Agent Cookie 522 stars。他怎么做到的？答案是一句话：停止 prompt Agent，开始设计循环让 Agent 自己 prompt 自己。一句话判断 Matt Van Horn 不是在写代码。他把"自己 prompt Agent 做事"这件事本身变成了一个循环。他设计的是 Agent 的操作系统，而不是 Agent 的指令。这跟 Tibo 让 Codex 支持任何模型是同一个逻辑：不是在卷 prompt 质量，是在卷 Agent 运行时的质量。三个项目，一个方法论 Matt 做了三个工具，恰好覆盖了一个 Agent Loop 的三层： | 层 | 项目 | 做什么 | Stars | |---|------|--------|-------| | 感知 | last30days | 多源社交媒体搜索，13 个平台并行，告诉 Agent 外部的讨论是什么 | 30K+ | | 执行 | Printing Press | CLI 工厂，把任何 API 变成 Agent 能高效调用的工具接口 | 3.4K 赞 | | 基础设施 | Agent Cookie | 跨机器浏览器会话同步，让 Agent 永远保持登录 | 522 | 三层的关系：last30days 告诉 loop 该做什么 → Printing Press 给 loop 提供执行的工具 → Agent Cookie 让 loop 在无人值守的机器上持续跑。本质上，这就是一个 Agent OS 的雏形。怎么设计 loop？拆解 last30days 的 1400 行 SKILL.md last30days 不是一个"工具"。它是 Matt 对"Agent Loop 怎么设计"这件事的最完整表达。它的架构分两层： • Python 引擎：负责机械工作——并行搜索 13 个平台、按 engagement 排序、跨源聚类合并、去噪。它是"肌肉"。 • 1400 行 SKILL.md：负责判断工作——怎么解读结果、怎么合成输出、什么格式才是对的。它是"大脑"。关键设计：用 8 条 LAW 约束 LLM SKILL.md 不是文档。它是用自然语言写的有限状态机。核心是 8 条 LAW，每条都有"named failure mode"： | LAW | 约束内容 | 对应回归 | |-----|---------|---------| | LAW 1 | 禁止末尾输出 Sources 段 | Peter Steinberger disaster #3 | | LAW 2 | 禁止发明标题 | v3.0.6 0/8 public regression | | LAW 3 | 禁止 em-dash | 通用 AI-slop tell | | LAW 4 | 禁止 ## 段落标题 | Peter Steinberger disaster #2 | | LAW 6 | 禁止直接输出 raw evidence | Hermes 2026-04-19 disaster | 每一条 LAW 背后都是一个具体的、可命名的失败案例。这跟软件团队的 postmortem 逻辑完全一样——bug 被发现 → 起名字 → 加规则 → 验证。 loop 流程：从 raw topic 到最终输出输入 "Kanye West" ↓ STEP 0: 引擎自检（你读的是最新版 SKILL.md 还是 stale clone？） ↓ STEP 0.45: query 质量检查（"给 42 岁男人的礼物" → reframe，这种词没人发） ↓ STEP 0.55: 解析实体 → @kanyewest + r/Kanye + GitHub 关联 ↓ STEP 0.75: LLM 生成 JSON query plan（搜索策略、权重分配） ↓ STEP 1: Python 引擎并行搜索 13 个源 → 按 engagement 排序 → 跨源聚类 ↓ STEP 2: LLM 补充 WebSearch 填补博客/新闻空白 ↓ Judge: LLM 按 8 条 LAW 合成最终输出 ↓ 反馈闭环: 每个回归都有名字 → 下次循环修复这个流程的厉害之处不在于任何一个单独的步骤，而在于"代码 + 自然语言契约"的混合体。代码做机械的搜索排序，LLM 做需要判断的合成。两者之间的接口就是 SKILL.md。停止 prompt Agent，开始设计 loop——这意味着什么 Matt 在 6 月 3 日的推文中总结了他的 20 条方法论： 1. 有想法 → /ce-plan 生成 plan（不自己读，plan 是给 Agent 的） 2. 模糊的想法先 /ce-brainstorm 3. Make the plan, don't read it 4. 用语音，不打字 5. 跑 4-6 个 tab 并行任务 6. 不给 Agent 设权限限制（YOLO） 7. 你是品味，Agent 是手 8. 任何事做两次 → 写一个 skill 9. 永远不关机的笔记本 10. 跑 last30days 再做 plan 这 20 条的核心只有一句话：你不再是一个 prompt writer。你是一个 loop designer。过去的 workflow：人有想法 → 人写 prompt → Agent 执行 → 人看结果 → 人写下一个 prompt 现在的 workflow：人有想法 → loop 读取信号 → loop 生成 prompt → Agent 执行 → loop 检查结果 → loop 决定下一步人从操作者变成了监督者。对内容工作室的实际意义回到我们的场景：做选题、侦察、创作的整个过程，其实也可以设计成 loop： 1. 感知层：定时任务触发 → agent_search + last30days 并行拉素材 2. 执行层：LLM 打分推荐 → 生成草稿 → 人去审查、调整品味 3. 基础设施层：所有流程写进 skill，重复两次就固化 Matt 做 last30days 的本质，就是把"手动搜 Reddit + X + YouTube"这件事变成了一个 loop。我们做内容工作室的本质，就是把手动搜素材、写草稿、发布这件事，逐步变成一个个 loop。今天的 prompt engineering 只是这一步的演练。真正的复利在于：你每写一个 skill，loop 的自动化就深一层。 #AI工程 #AgentLoop #AgenticEngineering #开源

查看原文

查看缓存全文

缓存时间: 2026/06/18 22:22

30 天 360 个 PR、不会写代码、不看 Plan：Matt Van Horn 的 Agent Loop 是怎么设计的

上个月，一个叫 Matt Van Horn 的人引起了我的注意。

• 没有 CS 学位 • 不会写代码 • 不看 AI 写的 plan

但过去 30 天，他在 GitHub 上合入了 360 个 PR，横跨 40 个仓库，平均每天 12 个。

他做的 last30days 达到 30,000+ GitHub stars，一度 #1 trending。Printing Press 发布的推文 3,447 赞。Agent Cookie 522 stars。

他怎么做到的？答案是一句话：停止 prompt Agent，开始设计循环让 Agent 自己 prompt 自己。

一句话判断

Matt Van Horn 不是在写代码。他把“自己 prompt Agent 做事“这件事本身变成了一个循环。他设计的是 Agent 的操作系统，而不是 Agent 的指令。这跟 Tibo 让 Codex 支持任何模型是同一个逻辑：不是在卷 prompt 质量，是在卷 Agent 运行时的质量。

三个项目，一个方法论

Matt 做了三个工具，恰好覆盖了一个 Agent Loop 的三层：

层	项目	做什么	Stars
感知	last30days	多源社交媒体搜索，13 个平台并行，告诉 Agent 外部的讨论是什么	30K+
执行	Printing Press	CLI 工厂，把任何 API 变成 Agent 能高效调用的工具接口	3.4K 赞
基础设施	Agent Cookie	跨机器浏览器会话同步，让 Agent 永远保持登录	522

三层的关系：last30days 告诉 loop 该做什么 → Printing Press 给 loop 提供执行的工具 → Agent Cookie 让 loop 在无人值守的机器上持续跑。

本质上，这就是一个 Agent OS 的雏形。

怎么设计 loop？拆解 last30days 的 1400 行 SKILL.md

last30days 不是一个“工具“。它是 Matt 对“Agent Loop 怎么设计“这件事的最完整表达。

它的架构分两层： • Python 引擎：负责机械工作——并行搜索 13 个平台、按 engagement 排序、跨源聚类合并、去噪。它是“肌肉“。 • 1400 行 SKILL.md：负责判断工作——怎么解读结果、怎么合成输出、什么格式才是对的。它是“大脑“。

关键设计：用 8 条 LAW 约束 LLM

SKILL.md 不是文档。它是用自然语言写的有限状态机。核心是 8 条 LAW，每条都有“named failure mode“：

LAW	约束内容	对应回归
LAW 1	禁止末尾输出 Sources 段	Peter Steinberger disaster #3
LAW 2	禁止发明标题	v3.0.6 0/8 public regression
LAW 3	禁止 em-dash	通用 AI-slop tell
LAW 4	禁止 ## 段落标题	Peter Steinberger disaster #2
LAW 6	禁止直接输出 raw evidence	Hermes 2026-04-19 disaster

每一条 LAW 背后都是一个具体的、可命名的失败案例。这跟软件团队的 postmortem 逻辑完全一样——bug 被发现 → 起名字 → 加规则 → 验证。

loop 流程：从 raw topic 到最终输出

输入 “Kanye West” ↓ STEP 0: 引擎自检（你读的是最新版 SKILL.md 还是 stale clone？） ↓ STEP 0.45: query 质量检查（“给 42 岁男人的礼物” → reframe，这种词没人发） ↓ STEP 0.55: 解析实体 → @kanyewest + r/Kanye + GitHub 关联 ↓ STEP 0.75: LLM 生成 JSON query plan（搜索策略、权重分配） ↓ STEP 1: Python 引擎并行搜索 13 个源 → 按 engagement 排序 → 跨源聚类 ↓ STEP 2: LLM 补充 WebSearch 填补博客/新闻空白 ↓ Judge: LLM 按 8 条 LAW 合成最终输出 ↓ 反馈闭环: 每个回归都有名字 → 下次循环修复

这个流程的厉害之处不在于任何一个单独的步骤，而在于“代码 + 自然语言契约“的混合体。代码做机械的搜索排序，LLM 做需要判断的合成。两者之间的接口就是 SKILL.md。

停止 prompt Agent，开始设计 loop——这意味着什么

Matt 在 6 月 3 日的推文中总结了他的 20 条方法论：

有想法 → /ce-plan 生成 plan（不自己读，plan 是给 Agent 的）
模糊的想法先 /ce-brainstorm
Make the plan, don’t read it
用语音，不打字
跑 4-6 个 tab 并行任务
不给 Agent 设权限限制（YOLO）
你是品味，Agent 是手
任何事做两次 → 写一个 skill
永远不关机的笔记本
跑 last30days 再做 plan

这 20 条的核心只有一句话：你不再是一个 prompt writer。你是一个 loop designer。

过去的 workflow：人有想法 → 人写 prompt → Agent 执行 → 人看结果 → 人写下一个 prompt 现在的 workflow：人有想法 → loop 读取信号 → loop 生成 prompt → Agent 执行 → loop 检查结果 → loop 决定下一步

人从操作者变成了监督者。

对内容工作室的实际意义

回到我们的场景：做选题、侦察、创作的整个过程，其实也可以设计成 loop：

感知层：定时任务触发 → agent_search + last30days 并行拉素材
执行层：LLM 打分推荐 → 生成草稿 → 人去审查、调整品味
基础设施层：所有流程写进 skill，重复两次就固化

Matt 做 last30days 的本质，就是把“手动搜 Reddit + X + YouTube“这件事变成了一个 loop。我们做内容工作室的本质，就是把手动搜素材、写草稿、发布这件事，逐步变成一个个 loop。

今天的 prompt engineering 只是这一步的演练。真正的复利在于：你每写一个 skill，loop 的自动化就深一层。

#AI工程 #AgentLoop #AgenticEngineering #开源

相似文章

@cxjwin: 发现一个很实用的网站，专门收集各种现成的 Agent Loop 模板。核心理念就是：别再一直手动 prompt 了，设计好 loop 让 agent 自己跑完任务。里面有 Test Until Green、Fix CI Until G…

X AI KOLs Timeline

分享了一个收集现成 Agent Loop 模板的实用网站，核心理念是让 AI agent 自动完成任务，包含 Test Until Green 等常用 loop，适合配合 Claude Code 和 Cursor 使用。

@cellinlab: Loop Engineering 正在取代“你亲自给 agent 写 prompt”这件事。它的核心是：你不再直接 prompt agent，而是设计一个系统，让这个系统去 prompt agent。

X AI KOLs Timeline

Loop Engineering 正在取代直接为 agent 写 prompt 的方式，核心是设计一个系统来为 agent 编写 prompt。

@cellinlab: https://x.com/cellinlab/status/2064144608242679822

X AI KOLs Timeline

这篇文章介绍了 Loop Engineering 的概念——不再直接给 AI agent 写 prompt，而是设计一个系统（loop）来递归地让 agent 迭代工作，直到任务完成。文章详细对比了 Claude Code 和 Codex 在 automations、worktrees、skills、sub-agents 等五个构建块上的实现，认为这可能是未来与 coding agent 协作的趋势，但仍需警惕 token 成本和 AI slop 问题。

@li9292: 我推荐这个网址： https://loops.elorm.xyz 收录了几十个大神的 loop engineering的思路

X AI KOLs Timeline

一个精心整理的预构建代理循环（闭环工作流）集合，适用于 Claude Code 和 Cursor 等编码代理，包含触发器、反馈门控以及用于自主任务执行的退出条件。

@uniswap12: Claude Code 用到这个程度，我算是开眼了 Matt Van Horn 最近写了一篇长文，把他用 Claude Code 的所有技巧和工作流全盘托出了。这篇文章在开发者社区引起了不小的反响，因为他展示的东西已经远远超出了“用 AI…

X AI KOLs Timeline

Matt Van Horn 分享了使用 Claude Code 的高级工作流：先通过 plan.md 进行详细规划，再用语音输入和多窗口并行执行任务，展示了如何将 AI 深度融入开发流程，大幅提升效率。

相似文章

@cxjwin: 发现一个很实用的网站，专门收集各种现成的 Agent Loop 模板。 核心理念就是：别再一直手动 prompt 了，设计好 loop 让 agent 自己跑完任务。 里面有 Test Until Green、Fix CI Until G…

@cellinlab: Loop Engineering 正在取代“你亲自给 agent 写 prompt”这件事。 它的核心是：你不再直接 prompt agent，而是设计一个系统，让这个系统去 prompt agent。

@cellinlab: https://x.com/cellinlab/status/2064144608242679822

@li9292: 我推荐这个网址： https://loops.elorm.xyz 收录了几十个大神的 loop engineering的思路

@uniswap12: Claude Code 用到这个程度，我算是开眼了 Matt Van Horn 最近写了一篇长文，把他用 Claude Code 的所有技巧和工作流全盘托出了。这篇文章在开发者社区引起了不小的反响，因为他展示的东西已经远远超出了“用 AI…

提交意见反馈

@cxjwin: 发现一个很实用的网站，专门收集各种现成的 Agent Loop 模板。核心理念就是：别再一直手动 prompt 了，设计好 loop 让 agent 自己跑完任务。里面有 Test Until Green、Fix CI Until G…

@cellinlab: Loop Engineering 正在取代“你亲自给 agent 写 prompt”这件事。它的核心是：你不再直接 prompt agent，而是设计一个系统，让这个系统去 prompt agent。