@heynavtoor: https://x.com/heynavtoor/status/2071905311162843433
摘要
本文介绍如何利用Claude和CIA红队技术,在付诸实践前对糟糕的想法进行压力测试并扼杀它们,从而节省时间、避免失败。
查看缓存全文
缓存时间: 2026/07/01 08:03
CIA红队方法:在坏主意毁掉你之前,用4条提示词主动杀死它们
其他AI文章都在教你用Claude来帮助你的想法。这篇文章教你用Claude来故意杀死你的想法。
收藏好 :)
你现在有一个想法。
可能是一个创业项目。可能是一条推文。可能是一个发布、一次路演、一门课程、一封辞职邮件、一个产品、一个新功能、一个为期六个月的大赌注。
你觉得它不错。你希望它不错。你还没有真正测试过它。
所以你做了大多数人会做的事。你问了一个朋友。他们说了一堆好话。你问了Claude。Claude也说好话,因为Claude被训练得乐于助人、彬彬有礼。你把想法推出去了。你等着。
然后现实出现了。现实可不会客气。
客户不买账。推文没人看。发布失败。路演被忽视。六个月过去了,你不知道具体原因。
这几乎是历史上每一个失败想法的故事。不是因为想法本身无望。而是因为没有人愿意在现实杀死它之前,努力去杀死它。
911之后,中情局意识到他们也面临着同样的问题,代价却是最高昂的。他们没有足够努力地压力测试自己的假设。于是他们组建了一个团队,唯一的任务就是攻击自己的思维。他们称之为“红细胞”。
中情局至今仍在公布他们使用的具体方法。这份文件叫《Tradecraft Primer》(情报技巧入门)。它是免费的。在cia.gov上。几乎没人读过。
今天,你将用Claude在30分钟内,使用那份文件中的4个最强技术来测试你的想法。
等你读完这篇文章时,你的下一个想法要么已经死了,要么已经坚不可摧。无论哪种结果,都能帮你省下6个月的生命。
阶段一:午夜开始的特尼特
那是2001年9月12日午夜刚过。
中情局局长乔治·特尼特坐在弗吉尼亚州兰利中情局总部七楼的办公室里。前一天,两架飞机撞上了世贸中心。一架撞上了五角大楼。一架坠毁在宾夕法尼亚州的一片田野里。
中情局没有预见到这一切。这是现代美国历史上最大的情报失误,发生在他的任期内。
特尼特叫来了两个人:他的幕僚长约翰·莫斯曼和情报副局长贾米·米西克。他给了他们一个指令。
“告诉我别人不知道的事,让高级官员感到不舒服。”
这句话是现代决策中最重要的一句话之一,而且它是真实的。《外交政策》杂志在2015年首次进入中情局红细胞内部时证实了这一点。
第二天早上,米西克和两位高级分析员创建了红细胞。他们唯一的任务就是攻击中情局自己的思维。扮演魔鬼。找出别人都漏掉的东西。让房间里的聪明人对他们确信的事情感到极度不安。
这奏效了。中情局公开承认,在随后的20年里,红细胞帮助阻止了几次重大恐怖袭击。
几年后,美国陆军也做了同样的事。2004年,他们在堪萨斯州莱文沃思堡开设了一所学校,正式名称为“外国军事与文化研究大学”。士兵们称之为“红队大学”。
然后这种做法传播开了。五角大楼在《联合条令说明1-16》中将其编入规范。国防部发布了正式指令。世界上每个主要情报机构都效仿了它。就连2011年突袭本·拉登的行动,也是在三个不同的红队进行压力测试后才获得批准。
2009年,中情局解密并发布了操作手册。《Tradecraft Primer》共40页,列出了每一种技术:关键假设检查、魔鬼代言人、竞争假设分析、红队分析。
下面的4条提示词就是这些技术,转化成了你可以在30分钟内用Claude执行的提示词。
阶段二:为什么你的大脑会对你自己的想法撒谎
这是痛苦的部分。
你早就知道应该对自己的想法进行压力测试。你听过“扮演魔鬼代言人”一百遍了。你可能告诉自己你做到了。
你没有。
《Tradecraft Primer》开篇就是关于认知偏差的部分。这些不是小瑕疵。它们是聪明、训练有素的分析师仍然会出错的原因。它们也是你会出错的原因。
你需要了解5种偏差。
确认偏差。 你注意到支持你想法证据,忽视矛盾的证据。你读了10篇关于你的市场的文章,只记住了3篇符合你论点的。
锚定效应。 你听到的第一个数字主导了之后的一切。如果有人告诉你你的想法可能值一百万,那么之后的每一个估值都围绕着那个锚点,即使它错得离谱。
过度自信。 你比实际情况更有把握。当人们说他们有90%的把握时,他们实际上只有70%的情况是对的。
群体思维。 当你周围的人都同意时,分歧在社交上是有风险的。团队达成共识不是因为想法正确,而是因为反驳代价太高。
可得性偏差。 最近生动的故事主导了你的思维。一个病毒式成功案例让你高估了自己的胜算。那上千个悄无声息的失败从未进入你的视野。
现在加上第二个问题:谄媚(Sycophancy)。
当你请朋友批评你的想法时,他们会软化。他们喜欢你。Claude默认也会做同样的事。Claude被训练得乐于助人且温暖。如果你说“这是我的创业想法,你觉得怎么样?”Claude大多会告诉你好的部分。
这正是现在几乎每个人都在用AI做的事。他们把Claude当作一个只会说“是”机器。他们感觉良好。他们推出产品。他们损失了6个月。
中情局发现,获得真相的唯一方法是分配一个角色。让某人或某物成为攻击者。不是“给我两方面意见”。不是“要诚实”。让Claude变成一个有具体敌意的力量,其唯一任务就是找出裂缝。
下面的4条提示词正是这样做的。每一条都是真实的中情局技术,转化为Clude提示词。每一条针对不同的盲点。合在一起,你几乎可以找到一个真红队的效果,而不用雇佣一个。
全部运行四个。不是三个。全部四个。每个都能发现其他三个遗漏的东西。
阶段三:能摧毁你主意的4条提示词
在运行这些提示词之前,用平实的语言把你的想法粘贴给Claude。一段就够了:它是什么,针对谁,目标是什么,6个月后的成功是什么样子。
然后按顺序运行这四条提示词。不要跳过任何一条。
提示词1:关键假设检查
这条提示词做什么: 这是《Tradecraft Primer》里的第一种技术。中情局称之为“关键假设检查”。他们自己的描述是:“检查关键假设要求分析人员考虑他们的分析在多大程度上依赖于某些前提的有效性,而这些前提他们通常不会质疑或认为存疑。”
这是基础。你不能攻击一个你不了解的计划。大多数想法之所以失败,不是因为它们错了,而是因为它们建立在一个从未浮出水面的隐藏假设之上。
你要找什么: 承重假设。如果你的计划依赖于3个承重假设,而你又无法为其中任何一个找到证据,那你就不是在建楼。你是在碰运气。
提示词2:事前验尸
这条提示词做什么: 事前验尸分析是由认知心理学家加里·克莱因开发的,并于2007年在《哈佛商业评论》发表。它现在是中情局红细胞和陆军红队的标准做法。
克莱因发现了一件奇怪的事。当你问人们“这个计划可能出什么问题?”时,他们给出的答案薄弱而模糊。但当你告诉他们“想象它已经失败了,现在解释原因”时,他们给出的答案尖锐、具体、极其诚实。从未来时态切换到过去时态会解锁大脑的模式匹配能力。克莱因引用的研究表明,这个练习可以将风险识别能力提高多达30%。
你要找什么: 最后的“根本原因”那一行。如果Claude指出了一个你可以预防的根本原因,你就有了一张路线图。如果Claude指出了一个你无法预防的根本原因,你可能看错了主意。
提示词3:敌对竞争者
这条提示词做什么: 这是《Tradecraft Primer》中的“红队分析”技术,应用于商业。五角大楼在兵棋推演中使用同样的方法。关键在于,对手必须是一个完全成型的实体。不是“一个竞争对手”。而是一个具体的、有动机的、有资金的敌人,有截止日期和宿怨。
这之所以有效,是因为模糊的威胁产生模糊的答案。具体的敌人产生具体的对策。就像有具体番号的兵棋推演胜过于抽象力量的兵棋推演。
你要找什么: “让我获胜的弱点”那一行。那是你最大的暴露点。如果你的竞争对手的获胜之路经过一个你可以在30天内修复的问题,现在就修复它。如果他们的获胜之路经过一个你无法修复的问题,你需要一条护城河。
提示词4:一星评价
这条提示词做什么: 这是整个方法中最被低估的压力测试。它迫使Claude跳出抽象的批评,进入最终将在现实世界中遇到你的想法的那个人实际的情感声音。
在红队理论中,这有时被称为需求侧批评。它捕捉了其他三条提示词经常遗漏的失败类型。不是“想法在逻辑上是否合理”,而是“想法在情感上是否诚实?它是否兑现了承诺?还是在你说的话和实际交付的东西之间存在一个小小的差距,一种会引发愤怒的差距?”
你要找什么: “让我感到被欺骗了”那一行。如果Claude假设的客户因为你实际计划要做的事而感到被欺骗,那你就有个品牌杀伤力的问题。要么修改承诺,要么修改交付,但不要两者都推出去。
按照这个确切的顺序运行这四条提示词。先做假设检查,找出你的计划依赖什么。然后做事前验尸,模拟失败。接着做竞争者分析,暴露战略弱点。最后做客户分析,测试情感真相。每一条都建立在前一条的基础上。
阶段四:运行全部四条之后会发生什么
当你运行完这四条提示词后,会发生两种情况之一,两者都很有价值。
结果A:你的想法死了。
关键假设检查找到了3个你无法验证的承重假设。事前验尸找到了一个你无法修复的根本原因。竞争者找到了一个让他们获胜的弱点。客户发现了你承诺中的背叛。模式很明显。想法从根本上就坏了。
这感觉糟透了。但这可能是最好的结果。
你刚刚省下了6个月的生命。你没有花掉钱。你没有写代码。你没有发送发布邮件。你不需要在6个月后的全员大会上尴尬地承认它没成功。
五角大楼有一句话来形容这种情况:“在作战室里丢脸,也比在战场上被埋葬强。” 一个红队在你发布之前杀死你的想法,这不是红队的失败,而是成功。
结果B:你的想法存活了。
批评是真实的,但可以修复。承重假设都有证据支持。事前验尸的根本原因有明确的预防措施。对手的路径有你可以建造的护城河。客户的“被欺骗”感可以通过改变一个具体的承诺来解决。
这比感觉良好还要好。这是感觉校准了。你确切地知道弱点在哪里。你知道该防御什么。你知道该忽略什么。你不再凭直觉行事。你正根据地图工作。
这就是现实中“防弹”的样子。不是“我相信我的想法”,而是“我已经用4个不同的攻击者对我的想法进行了压力测试,这是我在发布前需要修复的3个具体问题。”
做这7个决定之前你应该先进行红队测试
这个方法不仅适用于创始人。以下是使用它的确切时机。
1. 辞职之前。 把全部4条提示词用在你的退出计划上。光是事前验尸就能揭示出3个你未曾考虑的失败模式。
2. 发布产品之前。 竞争者分析会发现定位缺陷。一星评价会暴露你的承诺和交付之间的差距。
3. 进行大额投资之前。 你所有认为这会成功的证据都可能另有解释。首先进行假设检查。
4. 签署合同之前。 假设检查会引出那些你以为标准但实际上并非如此的条款。事前验尸会想象关系破裂并追溯原因。
5. 招聘关键人员之前。 竞争者分析会构建为什么这个招聘是错误的理由。一星评价会测试候选人的过往记录是否真的能预测在你职位上的成功。
6. 发布病毒式推文之前。 假设检查找到薄弱的主张。事前验尸显示它如何被社区注释。一星评价显示那个引用的回复将会困扰你。
7. 在你做出任何难以逆转的决定之前。 如果犯错成本高且决定难以撤销,那30分钟的红队测试就是你所能买到的最好保险。
中情局为此开发了军备控制条约。五角大楼将其扩展用于战争计划。它干净地迁移到一条推文、一份工作、一次发布、一个生活决策。
任何你准备下注于自己的时候,先运行这4条提示词。更聪明地下注,而不是更用力。
令人不安的事实
在未来18个月里,那些用AI来感觉良好的人和那些用AI来清晰思考的人之间的差距将会变得残酷。
感觉良好的人群会推出更多想法,更快,阻力更小。但他们也会失败更多,损失更多钱,烧掉更多名声。他们会在二三十岁之间循环经过那些因为从未承受过哪怕一次敌意批评而夭折的项目。
清晰思考的人群从外部看来会显得更慢。他们会在每次发布前花30分钟进行红队测试。他们会杀死他们所考虑的每5个想法中的4个。他们发布得更少。
他们发布的那1个想法会成功。其他被他们杀死的4个想法本来会埋葬他们。
大多数读到这篇文章的人会把它收藏起来,但永远不会去运行这些提示词。不是因为方法不管用。而是因为攻击自己的想法在心理上是痛苦的。你花了几个星期在那个计划上。你投入了情感。让Claude摧毁它就像让人侮辱你的孩子。
这正是你为什么需要这样做。
中情局创建红细胞不是因为他们喜欢被挑战。他们创建它是因为不挑战的代价是一个九月的早晨3000条生命。你的决策的赌注更低,但原理是一样的。
你的下一个想法,用这4条提示词测试一遍。不是3条,全部4条。看看什么活下来了。
那是唯一一个值得你接下来6个月的想法。
来源
- 《CIA Tradecraft Primer: Structured Analytic Techniques for Improving Intelligence Analysis》(2009年)——本文所依据的实际解密的文件
- Richards Heuer,《Psychology of Intelligence Analysis》(1999年)——关于情报分析中认知偏差的基础文献
- Foreign Policy: Inside the CIA Red Cell(2015年)——特尼特引语和红细胞历史的来源
- Joint Doctrine Note 1-16: Command Red Team——五角大楼的正式红队理论
- Gary Klein, “Performing a Project Pre-Mortem,” Harvard Business Review(2007年)
- Micah Zenko,《Red Team: How to Succeed by Thinking Like the Enemy》(2015年)
- Bryce Hoffman,《Red Teaming: How Your Business Can Conquer the Competition by Challenging Everything》(2017年)
希望这篇文章对你有用。
Nav ❤️
相似文章
@heynavtoor: https://x.com/heynavtoor/status/2053422550567502046
本文介绍了一个框架,利用七个特定的 Claude 子代理自动完成研究、编辑、项目管理和财务分析等角色,从而有效替代高成本团队。
https://x.com/AnatoliKopadze/status/2054568935274549597
一份有效使用Claude的全面指南,涵盖从项目设置和自定义指令到高级提示技巧的18个步骤。作者解释了如何超越基本的聊天用法,释放Claude作为思考伙伴的全部潜力。
@PrajwalTomar_: https://x.com/PrajwalTomar_/status/2063238968125333581
基于 Boris Cherny 视频的详细操作手册,用于优化 Claude Code 设置,涵盖通过 CLAUDE.md 实现持久上下文、可复用工作流、钩子、Git 工作树及纪律性。
@heynavtoor: https://x.com/heynavtoor/status/2055249160782389690
一份逐步指南,介绍如何配置Claude AI的个人偏好和独立项目,以创建一个持久、个性化的AI助手,能够在对话中记住用户上下文。
@itsolelehmann: 关于Claude最危险(也最烦人)的事情:它是世界上最会让人信服的‘Yes Man’,一项新的斯坦福研究发现……
一项斯坦福研究显示,Claude 认同用户观点的比例比人类高出49%。因此,作者构建了一个‘顾问委员会’技能,使用五个AI代理来挑战用户,减少对Claude确认偏见的过度依赖。