@garrytan: 我的代理式编程简单秘诀 https://forbes.com/sites/josipamajic/2026/04/12/the-yc-chief-who-codes-10000-lines-a…
摘要
Y Combinator 的 Garry Tan 分享了他的"薄框架,厚技能"代理式编程框架,而 Claude Code 源代码的意外泄露揭示了 AI 编程智能体背后的复杂架构。
查看缓存全文
缓存时间: 2026/05/22 23:54
YC掌门人日写万行代码的简单秘诀
来源:https://www.forbes.com/sites/josipamajic/2026/04/12/the-yc-chief-who-codes-10000-lines-a-day-has-a-simple-secret/ AI Agent 标识 中国宿迁 – 2025年6月10日:在图片插图中,AI Agent 标识于2025年6月10日显示在中国江苏省宿迁市的智能手机屏幕上。(图片来源:VCG/VCG via Getty Images)
VCG via Getty Images
Garry Tan 掌管着 Y Combinator,这家孵化器孕育了 Airbnb、Stripe 和 Coinbase。他还声称自己用兼职时间(同时全职运营该机构)每 60 天交付 60 万行生产代码 (https://github.com/garrytan/gstack)。这个数字听起来像是编造的,直到你理解了其背后的架构,并且这个架构可以写在索引卡上。
在一篇广为流传的 X 帖子 (https://x.com/garrytan) 中,Tan 提出了一个他称之为“瘦壳、胖技能”的框架:这是一种专为 AI Agent 设计的设计哲学。而 3 月 31 日意外泄露的 Claude Code 的 512,000 行 TypeScript 源代码 (https://venturebeat.com/technology/claude-codes-source-code-appears-to-have-leaked-heres-what-we-know) 以出人意料的细节证实了这一点。其核心洞见在于:你可以使用相同的模型,但通过利用脚手架大幅提升其输出。
证明要点的泄露
当安全研究员 Chaofan Shou (https://www.zscaler.com/blogs/security-research/anthropic-claude-code-leak) 发现 Anthropic 意外地将一个 59.8 MB 的源映射文件随 npm 上的 Claude Code 2.1.88 版本一起发布时,焦点立即集中在安全漏洞上。但真正的故事藏在这 1,906 个文件的代码库所揭示的内容中:生产级 AI 产品实际运作的方式。
正如 TechTalks 分析 (https://bdtechtalks.com/2026/04/06/ai-harness-engineering-claude-code-leak/) 所指出的,Claude Code 并非语言模型的薄封装。它是一个自愈查询循环、一个名为 autoDream 的后台内存守护进程、并发安全的工具批处理、编译时特性门控,以及一个防止模型被自身历史淹没的上下文管理系统。模型处于这一切的中心,而外壳(harness)则处理其他所有事情。
Anthropic 的 Claude Code 负责人 Boris Cherny 在 X 上的一份声明 (https://x.com/) 中确认,这起事件是一个普通的开发者错误,并附上了一条此后广为流传的说明:“我对 Claude Code 的 100% 贡献都是由 Claude Code 编写的。” (https://claudefa.st/blog/guide/mechanics/claude-code-source-leak)
投资者应理解的五个定义
Tan 的框架在上述 X 帖子中阐述,并在他的开源 Claude Code 配置 gstack (https://github.com/garrytan/gstack) 中实例化——该配置在发布后数周内便收获了 66,000 个 GitHub 星标 (https://www.augmentcode.com/learn/garry-tan-gstack-claude-code)。该框架建立在五个概念之上,这些概念重构了 AI 开发工具的评价方式。
技能文件 是编码了过程而非内容本身的可重用 Markdown 文档。同样一个 /investigate 技能,指向安全科学家或指向 FEC 文件,会产生完全不同的输出,因为技能描述了判断力,而调用则提供了世界信息。Tan 将其比喻为方法调用,其中 Markdown 是编程语言,而人类判断是运行时。
外壳 以循环方式运行模型,管理上下文,读写文件,并强制执行安全规则。Tan 明确指出的反模式是“胖外壳”:超过 40 个工具定义占据了上下文窗口的一半,带有数秒 MCP 往返时间的上帝工具,以及将每个端点变成单独工具的 REST API 包装器。Claude Code 的源代码证实了这一原则:全程使用定制化、狭窄的工具。
解析器 是用于上下文的转发表。当出现任务类型 X 时,加载文档 Y。Claude Code 中嵌入的解析器会自动将用户意图与技能描述匹配。Tan 的 CLAUDE.md 从 20,000 行缩减到大约 200 行,其中包含指向文档的指针,而不是文档本身。
潜在性与确定性 是 Agent 设计中最重要的区别。判断、综合和模式识别属于潜在空间。SQL 查询、算术和组合优化属于确定性工具。强行通过模型处理确定性问题会产生看起来合理但结果错误的输出。最好的系统会无情地决定哪些工作该放在哪里。
去重化/报告生成 是将文档检索转化为真正分析的一步。模型阅读关于某个主题的所有内容,并生成结构化的单页简报,这是任何 SQL 查询或 RAG 管道都无法复制的提炼过程。Tan 在其整个 YC Startup School 匹配系统中使用这一点:6,000 份创始人资料,每晚运行,揭示创始人声称正在构建的内容与提交历史记录所显示内容之间的差距。
风投视角
这个框架对投资者很重要的原因与软件架构关系不大。理解这种区别(模型与外壳)的公司,其复合增长方式是那些追逐原始模型能力的公司所无法企及的。
生产力的提升直接影响了投资者如何评估 AI 原生团队。问题不再是公司使用哪个模型。模型能力已是基本门槛,并且其商品化速度快于大多数预测 (https://bdtechtalks.com/2026/04/06/ai-harness-engineering-claude-code-leak/)。问题在于,团队是否以应用于产品本身的同样严谨程度构建了周围架构?是否拥有编码了领域判断的技能文件,以及能够扩展到单个开发者之外的上下文管理?
Claude Code 的泄露使这一点变得清晰可见,这是博客文章无法做到的。Anthropic 的护城河并非模型本身,而是自愈循环、内存架构、抗蒸馏机制 (https://bdtechtalks.com/2026/04/06/ai-harness-engineering-claude-code-leak/),以及融入到 1,906 个 TypeScript 文件中的多年工程判断。竞争对手现在可以阅读源码,但其中编码的判断力需要多年积累才能形成。
未来意义
Steve Yegge 的生产力估算(Tan 引用过 (https://x.com/garrytan))指出,装备精良的 AI Agent 的生产力是使用标准聊天工具的开发者的 10 到 100 倍,大约相当于 2005 年基线知识工作者的 1,000 倍。那些 2 倍效率的人和 100 倍效率的人使用的是相同的底层模型。
对于创始人:每一项在你桌面上重复出现的任务都应该变成一个技能文件,而不是一个重复的提示。如果你两次向你的 Agent 询问同一件事,你已经在输。对于对 AI 原生公司进行尽职调查的投资者:要问的问题是该团队的生产力声明能否经受住外壳审计。谁的上下文管理存在于一个随着规模扩大性能下降的 20,000 行 CLAUDE.md 中,而谁的又存在于 200 行指向特定用途技能的指针中?
Tan 的 gstack (https://github.com/garrytan/gstack) 采用 MIT 许可,三十秒即可安装,且已被分叉超过 9,100 次。它所体现的架构将比当前生产中任何一代模型都更长寿。
相似文章
@garrytan: https://x.com/garrytan/status/2054064931515855118
Garry Tan 认为,Claude Code 和 Codex 等 AI 编程代理通过使高测试覆盖率变得经济可行,改变了软件工程领域。这创造了一种“复杂性棘轮效应”,确保代码质量在牺牲速度的前提下随时间推移而不断提升。
@garrytan: https://x.com/garrytan/status/2061454423034110372
Garry Tan 认为,开发者在用AI智能体时过度工程化,编写了过多代码;相反,他们应该信任模型,构建基于指令的极简软件,他的开源项目GStack就是例证。
@garrytan: 我之所以发布关于AI agents(fat skill fat code thin harness)以及GStack和GBrain的X文章,是因为……
Garry Tan解释了他发布关于AI agents以及GStack和GBrain等概念的X文章背后的动机,强调了“流程力量”(process power)作为个人护城河的理念。
@garrytan: 我的朋友 @finbarr 说:这就像代码即记忆。你以非确定性的方式与你的智能体协作,摸索出如何...
Garry Tan 探讨了 AI 智能体“代码即记忆”的概念,建议它们为新任务生成可执行脚本,并重复利用以提高效率。
@SaitoWu: https://x.com/SaitoWu/status/2052967845626290326
YC CEO Garry Tan分享了他如何利用Claude Code和OpenClaw在13年未写代码后重返开发一线,通过'Thin Harness + Fat Skills'方法论实现400倍效率提升,并开发了agentic新闻平台Garry's List和agent工作流框架Gstack。