@zachlloydtweets: https://x.com/zachlloydtweets/status/2065154860337508577
摘要
这篇文章概述了一个使用Warp技能的规范驱动开发的五步工作流程:编写产品规范(PRODUCT.md),编写技术规范(TECH.md),使用任何AI代理进行实现,验证实现与规范一致,以及使用Oz进行计算机使用验证。这些技能是开源的,可以通过npx安装。
查看缓存全文
缓存时间: 2026/06/11 23:45
规范驱动开发所需的三个技能
如果你想让 AI 智能体更大概率构建出正确的东西,你就应该编写规范来指导它。这很简单:编写描述用户行为的产品规范,以及描述实现策略的技术规范。这些规范应以 Markdown 文件的形式编写,并纳入实现的拉取请求(PR)中,以便你的队友可以审查。你应该使用技能(Skills)来编码整个流程。下面是这个流程,它既可以在 Warp 内部使用,也可以在外部使用,并且全部开源,你可以根据项目调整规范。
1. 从使用 /write-product-spec 编写产品规范开始
该技能会在当前仓库的 specs/ 目录下创建一个 PRODUCT.md 文件。PRODUCT.md 的目标是从用户角度描述一个功能,即功能的“是什么”。它应包括对 Figma 模型、截图等的引用。格式是用户故事 + 一份非常详细的产品不变量列表,以便智能体可以在代码中验证,甚至可能通过计算机使用(computer use)来验证。
2. 接着使用 /write-tech-spec 创建技术规范
该技能会在同一个 specs 目录下创建一个 TECH.md 文件。TECH.md 的目标是描述功能的实现策略,即功能的“怎么做”。它应包括整体架构指南、具体的代码位置,以及智能体在编写代码时应该知道的任何其他信息。
3. 要求智能体实现规范
这应该适用于任何智能体,即使推理水平较低也能工作。
4. 验证实现是否与规范匹配
仅仅要求智能体实现规范是不够的,你还需要确保它正确地完成了。在审查实现 PR 时,我在 Warp 中使用一个技能名为 /validate-changes-match-specs,它要求智能体再次检查其工作,并反馈任何不一致之处。然后智能体带我逐一检查这些不一致之处,以及我希望如何解决它们。
0:16
5. 使用计算机使用(computer use)进行验证
最后,我们内部有一个专门的技能,使用 Oz 进行计算机使用来验证用户体验(UX)变更。这会为智能体创建一个云沙箱,使其可以通过鼠标和键盘访问来验证自身工作。我们构建了一个原生的 Rust 桌面应用程序,因此需要这种沙箱机制来让智能体进行端到端验证。你可以在此处看到实际操作。
你可以在 https://github.com/warpdotdev/common-skills 找到这些技能,并通过以下命令安装:
npx skills add warpdotdev/common-skills
非常希望听到大家是如何做这件事的!
相似文章
@so_ainsight:这简直太疯狂了。这家累计融资 110 亿日元的初创公司“Warp”(一款 AI 驱动的终端应用)…
AI 驱动的终端初创公司 Warp 已公开推出生产环境就绪的“oz-skills”,包含 15 项自动化 Agent 技能,可自动执行 CI 失败修复、GitHub Issue 分类与清理、SEO 审计等任务。
@zachlloydtweets: https://x.com/zachlloydtweets/status/2052497467883581677
Warp CEO Zach Lloyd 认为,AI 编码代理使得传统的「先对齐,后构建」产品开发流程变得过时,他主张快速构建并在内部进行 dogfooding,然后再寻求利益相关者的对齐。
Warp 开源
Warp 是一个由 AI 驱动的 Agentic 开发环境,现已开源,旨在与社区共同构建。
@chenchengpro: 最近大家都在聊 agent 的「loop」,但很少人讲清它到底是什么。Warp CEO Zach Lloyd 给了一个能落地的版本:让 Skill 从反馈里自我进化的双层循环,以 GitHub issue 三分类为例。 内循环:每来一个新…
Warp CEO Zach Lloyd 提出了一个双层循环方法,让 AI Agent 的 Skill 从用户反馈中自我进化,以 GitHub issue 自动三分类为例,内循环处理新 issue,外循环收集信号并提炼规则,已开源框架 oz-for-oss。
@tom_doerr: 为AI编码智能体封装高级工程师工作流程 https://github.com/addyosmani/agent-skills…
一个GitHub仓库,为AI编码智能体打包生产级工程技能,将高级工程师工作流程和质量门控编码为斜杠命令(如/spec、/plan、/build等),并包含Claude Code、Cursor及其他工具的设置说明。