@gyro_ai: https://x.com/gyro_ai/status/2055198700016660826
摘要
Matt Pocock 开源了 Skills for Real Engineers,一套小、可组合、可破解的 AI 编程技能,旨在解决 AI 编程中的理解偏差、缺少共享语言、反馈回路缺失和软件熵问题。该工具通过 grill-with-docs、tdd、diagnose 等技能提升 AI 编程效率,并提供了完整工作流。
查看缓存全文
缓存时间: 2026/05/15 11:00
别让重流程框架偷走你的控制权,这才是Real Engineers该用的技能组
你用 AI 写代码的时候,有没有遇到过这种情况:
跟 AI 聊了半天需求,它生成的代码跟你想的完全不是一回事。
改了几个版本,代码库里到处都是重复的类和方法。
辛辛苦苦构建的架构,没过多久就变成一团烂泥。
GitHub 上有个仓库,82.9k stars,专门解决这些问题。
Matt Pocock 和他的技能组
GitHub 仓库:https://github.com/mattpocock/skills
作者是 Matt Pocock,前 Vercel 开发者布道师,Total TypeScript 作者,现在在做 AI Hero 平台。
他把自己凝聚力几十年的软件工程之魂直接“蒸馏”出来,把自己日常用 Claude Code 的工程实战流程直接开源了。
仓库名字很直接:Skills for Real Engineers。
这套技能组有三个核心设计哲学:
Small — 单文件可读,每个技能都很小,几分钟就能看懂。
Composable — 自由组合,可以单独用,也可以串起来用。
Hackable — 可改造,不喜欢哪个环节,直接改成你自己的。
为什么不用 GSD、BMAD、Spec-Kit 这些工具?Matt 说:
“这些工具试图通过接管整个流程来帮你。但在这个过程中,它们拿走了你的控制权,流程里的 bug 也变得很难解决。”
我之前用过类似的工具,确实有这种感觉。
就比如 GSD 的工作流,头脑风暴、生成计划、执行计划、测试,一环扣一环,看起来很高大上。但是哪个环节出问题,你要改动非常麻烦。流程太重,改不动。
Matt 的方案是:用小的、可组合的技能,而不是一个大的流程框架。
要解决的四个问题
Matt 的技能组针对 AI 编程的四个核心问题:
1. Misalignment(理解偏差)
开发者和 agent 之间的理解不一致。你以为它懂了,其实它理解偏了。最后生成的代码跟你想的完全不是一回事。
2. Ubiquitous Language(缺少共享语言)
你说的“用户“和代码里的 User 是同一个东西吗?你说的“订单“和数据库里的 Order 是同一个概念吗?没有统一术语,AI 就会自己猜,猜错了你就得返工。
3. Feedback Loops(反馈回路缺失)
AI 一口气给你生成几百行代码,你怎么验证?哪行有问题你知道吗?没有快速反馈,错误会越积越多。
4. Software Entropy(软件熵加速)
代码库变成一团烂泥的速度比以前快多了。AI 没有全局观,它只会根据当前上下文尽力而为。如果你不控制,它就会越写越散。
核心技能有哪些
Matt 把技能分成三类:工程类、生产力类、杂项。
1.工程类技能:
grill-with-docs — 编程场景下用得最多。
它会一直问问题,问到你没问题为止。但它做了一个关键改动:会生成一个 context.md 文档,叫“共享术语表“。
你跟 AI 沟通需求时,对话里的术语会被记下来,方便后面编程时使用。
这个文档就是你的 Ubiquitous Language(统一语言)。
术语的作用是用简短的词去解决复杂的概念。在业务领域里,几个字就能代表一个完整的领域。
除了 context.md,它还会生成架构决策记录(ADR),作为后续流程的上下文。
这个直接解决 Misalignment 问题。
tdd — 基于测试的开发。
流程是:规划、写测试、测试失败、最小代码通过。
在 AI Coding 中,TDD 的核心作用是控制每一步的粒度。强制你把工作切成小片,每一步都可验证。
这个直接解决 Feedback Loops 问题。
diagnose — 诊断 bug。
用了六个阶段,是一套完整的debug方法论。
improve-codebase-architecture — 架构改进。
它会搜索你整个代码库,用一些好的架构和接口设计方法(比如 Deep Modules:功能丰富但接口简单),看你是否匹配。
找到可以优化的点,让你选择是不是要往下优化,然后给优化意见。
这个直接解决 Software Entropy 问题。
用 AI 编程一段时间,或者完成一个模块后,执行这个技能,让它帮你找优化点。
to-prd 和 to-issues — 跟 GitHub 关系紧密。
to-prd 会总结你的历史对话,生成 PRD 文档。
to-issues 把 PRD 转成 issues,给 issues 打标签(bug 还是功能)。
然后回到项目代码库里,去修改、迭代、更新这些 issues。
这是一个基于 GitHub issues 的小工作流。
2.生产力类技能:
grill-me — 非编程场景下的拷问模式。
caveman — 让 AI 用最简单的方式解释复杂概念。
handoff — 交接工作时生成上下文文档。
write-a-skill — 帮你写新的技能。
怎么安装
两种方式:
方式一:通过 Claude Code 安装(推荐)
bash# 在 Claude Code 中输入 /install mattpocock/skills
方式二:手动安装
bash# 克隆仓库到 .claude 目录 cd ~/.claude git clone https://github.com/mattpocock/skills.git
安装完之后,执行初始化:
bash# 在项目根目录执行 /setup
它会做这几件事:
-
扫描你的项目,检查是否已配置
-
修改你的 CLAUDE.md 文件,加入全局上下文
-
创建 context.md(术语表)
-
创建 docs/adr/ 目录(架构决策记录)
-
让你选择 issue 追踪器(推荐 GitHub)
-
让你选择领域文档模式(单项目用根目录,多项目用子目录)
初始化完成后,你会看到这些文件:
your-project/ ├── CLAUDE.md # 已更新 ├── context.md # 新建 ├── docs/ │ ├── adr/ # 新建 │ ├── agents.md # 新建 │ └── issues.md # 新建
推荐使用顺序
Matt 推荐的完整工作流:
第一步:需求对齐(grill-with-docs)
有新需求时,先用 grill-with-docs 进行头脑风暴。
bash/grill-with-docs
它会问你 15-20 个问题,问到你没问题为止。
问完之后,生成 context.md(术语表)和 ADR(架构决策)。
第二步:生成 PRD(to-prd)
需求对齐后,生成 PRD 文档。
bash/to-prd
它会总结你的历史对话,生成结构化的 PRD 文档,发布到 GitHub。
PRD 里有:
-
用户故事
-
模块划分
-
测试计划
-
不在范围内的需求
第三步:拆分任务(to-issues)
把 PRD 拆成可执行的小任务。
bash/to-issues
它会把大的 PRD 切成 3-5 个小任务,每个任务都是一个 GitHub issue。
然后给每个 issue 打标签:
-
bug — 修复问题
-
feature — 新功能
-
ready-for-agent — 可以交给 AI 处理
第四步:实现功能(tdd)
选一个 issue,用 TDD 方式实现。
bash/tdd #123
它会:
-
拉取 issue 描述
-
规划实现方案
-
写测试(先失败)
-
写最小代码让测试通过
-
重构优化
第五步:诊断 bug(diagnose)
遇到 bug 时,用 diagnose 诊断。
bash/diagnose
它会用六个阶段系统性地找问题:
-
复现问题
-
收集信息
-
提出假设
-
验证假设
-
定位根因
-
修复验证
第六步:架构优化(improve-codebase-architecture)
每隔几天,或者完成一个模块后,跑一次架构优化。
bash/improve-codebase-architecture
它会:
-
扫描整个代码库
-
给出 3-5 个优化方向
-
让你选择优先级
-
针对选中的方向给出具体方案
实际使用案例
我用 grill-with-docs 测试了一个需求:增加一个充值功能,充值完成后送积分。
它问了 20 个问题:
-
充值金额范围是多少?
-
支持哪些支付方式?
-
积分赠送比例是多少?
-
充值失败怎么处理?
-
退款时积分怎么扣减?
-
页面布局是什么样的?
-
需要发送通知吗?
问完之后,生成了 context.md:
markdown## 术语表
积分(Points) 用户在平台上的虚拟货币,可用于兑换商品或服务。
充值(Recharge) 用户通过支付真实货币获得积分的过程。
关键规则
- 充值金额:10-10000 元
- 积分比例:1 元 = 10 积分
- 赠送规则:充值满 100 元额外赠送 10%
- 退款规则:退款时扣除已使用积分,剩余积分按比例退回
然后用 to-prd 生成 PRD,用 to-issues 拆成 4 个任务:
-
充值页面 UI
-
支付接口对接
-
积分计算逻辑
-
退款处理逻辑
每个任务都标记了 ready-for-agent,可以直接让 AI 去实现。
用 tdd 实现第一个任务,它会先写测试,再写代码,保证代码质量。
完成后,用 improve-codebase-architecture 检查,它发现了 2 个优化点:
-
支付接口可以抽象成统一的 PaymentGateway
-
积分计算逻辑可以提取成独立的 PointsCalculator
按照它的建议优化后,代码可维护性明显提升。
不止是写代码
Matt Pocock 的这套技能,核心是两个字:控制。
你不是被工具推着走,而是你决定什么时候用哪个技能。每个技能都很小,可以单独用,
也可以组合用。出问题了,你知道是哪个环节的问题,改起来很快。
AI 让写代码变快了,但代码从来没变得更便宜。
代码会腐烂、会积累技术债、会需要维护。AI
只是让你更快地产出代码,但不会替你思考代码该怎么组织。
这套技能组教你的,不只是怎么用 AI 写代码,而是怎么在 AI 时代保持对工作的控制权。 写文章、做设计、做分析,任何需要 AI
协作的工作,都需要你先想清楚、建立共识、控制节奏、定期优化。
装上试试,你会发现不只是写代码的节奏变了。
关于我:Gyro,从游戏里长出来的工程脑。分享 AI 工具实践、系统思维、认知升级。
👉 关注我的 X 账号 @gyro
相似文章
@IndieDevHailey: 82.5k stars,18个技能,专治AI写代码翻车! TypeScript 大神 Matt Pocock(前 Vercel 工程师,教 TS 讲得最清楚的那个人)把他每天用 Claude 的真实工作方法开源了! 痛点就四个: 沟通不对…
TypeScript 大神 Matt Pocock 开源了他每天使用 Claude 的真实工作方法技能库,包含18个技能,通过 npx skills 一键安装,解决 AI 编程中的沟通对齐、术语统一、反馈循环和代码熵增问题。
@teach_fireworks: AI Coding 现在开始进入一个很有意思的阶段。 过去大家讨论最多的是模型能力、上下文长度、Agent Loop、Tool Use、自动化编程,但真正把 Agent 长时间放进真实开发环境之后,很多团队发现问题已经不只是“能不能生成代…
介绍开源工具 re_gent,它为 AI 编程 Agent 提供运行时级别的版本控制和可观测性基础设施,解决 Agent 长时间运行后的代码溯源与审计问题。
mattpocock/skills
该开源仓库提供了一套可组合的 AI 代理技能与提示词,专为 Claude Code 和 Codex 等编程助手打造,旨在提升模型对齐效果、减少冗长输出,并优化整体工作流。
@qloog: 别再说 AI 只是提效工具了。 这套OpenAI 官方都认可的 Codex 教程,直接让你一个人干完一个团队的活: 做 iOS App、写代码、出投资者 Deck,全流程打通。 核心就两件事: 自定义 Skill(能力复用) 自动化(效率…
OpenAI-endorsed Codex tutorial enables solo developers to build iOS apps, write code, and generate investor decks through reusable custom skills and automation.
@0xshimei: https://x.com/0xshimei/status/2053306900998181026
The author shares a curated list of 16 frequently used AI skills/tools that integrate into their daily workflow, categorized by function such as information gathering.