@Stephen4171127: https://x.com/Stephen4171127/status/2068955415778369751
摘要
本文介绍了Stanford的STORM研究方法,并提供了4个Prompt,让用户能在Claude中复制多视角研究流程,5分钟内生成博士级别的研究简报。
查看缓存全文
缓存时间: 2026/06/23 01:57
Stanford 偷偷开源了一套研究方法,4 个 Prompt 让 Claude 顶博士
[译文]Stanford 偷偷开源了一套研究方法,4 个 Prompt 让 Claude 顶博士
大多数人把 Claude 当搜索框用。问一句、看一眼、关页面。
最强的那个功能,他们一直没打开过。
Stanford 做过一套叫 STORM 的研究方法。同行评审实验里,它产出的文章比下一名方法组织度高 25%。开源、免费,几乎没人知道——同样的思路,你用 4 个 prompt 就能在 Claude 里跑起来。
不需要装软件。不需要 GitHub。不需要任何配置。复制粘贴就行。
5 分钟以后,你对一个话题的理解,会超过那些花了好几天读资料的人。
下面是完整方法。
Phase 1: STORM 到底是什么
STORM 的全称是 Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking(基于检索与多视角问询的主题大纲合成),由 Stanford OVAL Lab 在 NAACL 2024 上发表。
在线版可以直接在 storm.genie.stanford.edu 上用。免费、免注册。输入一个话题,看它当场写出一篇带引用的文章。
YouTube 上有一段 12 分钟的官方讲解视频(搜 “STORM by Stanford”),值得看一次。
完整源码托管在 github.com/stanford-oval/storm,MIT 协议,29k+ stars,你也可以拉到自己机器上跑。
但真正的彩蛋在这里:你根本不需要安装任何东西。
Stanford 的方法本质上是一种思考方式。你可以用 4 个复制粘贴的 prompt,在 Claude 里跑出同样的思考流程。
文章剩下的部分,就是这 4 个 prompt。
Phase 2: 为什么单个 Prompt 永远不够
你问 Claude“讲讲 X“,拿回来的永远是多数派视角。最常见的框架。最表层的共识。
你拿不到的是:
-
每天和 X 打交道的从业者(Practitioner)
-
认为整个领域方向错了的怀疑者(Skeptic)
-
沿着钱流走的经济学家(Economist)
-
见过类似模式的历史学家(Historian)
-
真正读过论文的学术研究者(Academic)
这 5 个声音看到的是完全不同的东西。
**博士生(PhD)做研究就是这样的。**他们不问一个问题,问五个。
Stanford 的论文用数据证明了这件事:多视角构建的文章,比单 prompt 方法组织度高 25%,覆盖广度宽 10%。这就是 STORM 的全部突破——多视角问询能抓出单 prompt 永远看不见的盲区。
博士级别的研究工作,通常需要一个人花 40 到 60 小时阅读。大多数人匀不出这个时间。STORM 把它压缩了一次。下面这 4 个 prompt 把它再压缩一次。总共 5 分钟。
Phase 3: Prompt 1——多视角扫描
这是整个方法的核心。
直接粘进 Claude,把【你的话题】那一行换成你要研究的内容。
我需要研究【你的话题】。
请模拟 5 种不同的专家视角分析这个话题:
-
从业者(The Practitioner):每天和它打交道。 学者们错过了哪些只有从业者才知道的事? 有哪些现实层面的考虑通常被忽略?
-
学者(The Academic):研究这个领域多年。 同行评审的证据实际上是怎么说的? 证据在哪些地方与流行看法相矛盾?
-
怀疑者(The Skeptic):认为主流观点是错的。 最有力的反驳论点是什么? 支持者们刻意忽略了哪些证据?
-
经济学家(The Economist):追踪资金流向。 谁从当前的叙事中获利? 什么样的财务激励在塑造这项研究?
-
历史学家(The Historian):见过类似的模式。 历史上有什么相似的先例? 那些先例最终的走向能教会我们什么?
对每一种视角,给我:
- 用 2 句话概括他/她的核心立场
- 支撑该立场最有力的证据
- 这一视角能告诉我、其他视角告诉不了的那一件事
你会拿到什么:同一个话题的 5 种截然不同的解读。从业者看见学术者忽略的,怀疑者挑战从业者默认的前提,经济学家挖出学术者不在意的利益结构,历史学家给出经济学家看不见的时间维度。
60 秒的工作量,抓住的是单 prompt 永远找不到的东西。
Phase 4: Prompt 2——矛盾地图
接下来让 Claude 找出 5 个声音在哪里打架。
打架的地方,就是真理藏身的地方。
基于上面 5 种视角,请绘制一张「矛盾地图」:
-
哪些视角之间出现了直接对立?把每对冲突连同它们各自的具体主张一起列出来。
-
哪一种视角的证据最硬?哪一种最弱?为什么?
-
如果只能回答一个问题就能化解最大的矛盾,那会是什么问题?
-
5 种视角全部认可的事实是什么? (这通常就是真相。连对手都点头的事,最可靠。)
-
5 种视角全都没提到的话题是什么? (这就是整个领域的盲点。往往是最有价值的发现。)
你会拿到什么:一张地图,标清楚专家在哪些地方分歧、为什么分歧。
大多数人会跳过这一步。但这一步,正是把表层理解和真懂的人区分开来的那道坎。
如果 5 个视角都一致,那它大概率是真的。 如果没有一个视角讨论过某件事,那你刚刚发现了整个领域的盲区。
Phase 5: Prompt 3——综合简报
让 Claude 把一切汇总成一份研究简报。
请把 5 种视角 + 矛盾地图综合成一份研究简报:
-
一段话总结:把这个话题讲给一位只有 60 秒、但需要细节而非头条的 CEO 听。
-
5 个关键发现:我现在掌握的最重要的事,按可靠性排序。每条标注:哪些视角支持、哪些视角挑战。
-
隐藏的关联:5 种视角放在一起看才能看出来的、一个不显而易见的发现间联系。
-
可执行的洞见:基于全部证据,一位身处【你的角色】的人应该具体怎么做才不一样?要具体。
-
前沿问题:如果能回答这一个问题,就会彻底改变我们对该话题的理解——它是什么?
你会拿到什么:一份没有任何单一专家能独立写出来的简报。它顾及到每一个角度、点出所有矛盾、对可靠性做了分级、最后落在一个具体动作上。
这是博士生 48 小时才能交出来的东西。你 90 秒就拿到了。
Phase 6: Prompt 4——同行评审
STORM 有一个公开的弱点。这是 Stanford 自己的研究人员标出来的——系统不会自我批判。来源偏倚(Source Bias)和事实错配(Fact Misassociation)会偷偷溜进来。
这个 prompt 就是用来堵这个洞的——让 Claude 给自己的作业打分。
现在请同行评审你自己刚才写的那份研究简报:
-
置信度评分(Confidence Scores):把 5 个关键发现按 1-10 分打分(可靠性),并解释每个分数的理由。
-
最薄弱环节(Weakest Link):哪条主张你最没把握?需要哪些具体信息才能验证它?
-
偏见检查(Bias Check):在综合时,哪一种视角可能被过度采纳?是否有一个声音盖过了其他声音?
-
遗漏的视角(Missing Perspective):是否还有第 6 种视角,加入后会改变结论?
-
总体评分(Overall Grade):如果一位 Stanford 教授来评审这份简报,会打几分,为什么?他/她会让你改哪里?
你会拿到什么:对你自己研究的一次诚实复盘。哪些主张站得住、哪些站不住、哪些角度漏了、哪些偏见在里面。
真正的同行评审要走几个月流程。你 60 秒就走完了一遍。
Phase 7: 5 分钟工作流
第 1 分钟:跑 Prompt 1。你得到 5 个专家视角。
第 2-3 分钟:跑 Prompt 2。你得到一张矛盾地图。
第 3-4 分钟:跑 Prompt 3。你得到一份研究简报。
第 5 分钟:跑 Prompt 4。你知道哪些可信、哪些不可信。
总耗时 5 分钟。产出:一份多视角简报 + 矛盾分析 + 综合判断 + 一个具体动作 + 一个可靠性评级。
一个博士生手工做出同等质量的工作,需要 40 到 60 小时。不是因为他慢——是因为“从 5 个角度读、画矛盾、综合、自我批判“这套动作,对一个人类大脑来说,真的就是 40 小时的活。
Phase 8: 7 个可以从今天开始用的场景
1. 写任何文章或报告之前。跑一遍 4 个 prompt。你的稿子会覆盖到别人想都没想过的角度。
2. 做重大商业决策之前。把 5 个视角都拿到。从业者告诉你现实里什么能跑、怀疑者告诉你哪里会翻车、经济学家告诉你这笔钱最后流进了谁的口袋。
3. 面试之前。5 分钟从 5 个角度研究目标公司。从业者视角给你内部人才听得懂的语言,怀疑者视角给你能问出真问题的尖刀。走进会议室时,你比屋里任何人都更有准备。
4. 投资之前。牛市派、熊市派、历史先例、激励链、学术证据——5 分钟全到位。矛盾地图告诉你真正的风险藏在哪。
5. 学一门新技能之前。从 5 个角度给整个领域画地图。从业者告诉你先学什么、学术者告诉你底层原理、怀疑者告诉你哪些是过度炒作。你跳过所有噪音。
6. 谈判之前。从 5 个视角研究对手。理解他们的激励、弱点、过往行为。你走进去就带着结构性优势。
7. 任何演讲之前。在你的话题上跑一遍 STORM。你的 slides 会在观众提问之前就答好他们的疑问。你的 Q&A 环节会从容得不像在临场。
Phase 9: 我们怎么把它做成日用工具
看完上面四步,你可能在想:每次都重新粘 4 个 prompt 也挺烦的。
我们(JumpX)的工作站跑着 Hermes Agent,已经把这套方法封装成了一个 skill。研究一个新话题时,一行命令就能跑完:
hermes chat -q “用 storm-research 研究:2026 年小型本地推理模型是否值得创业公司投入” -s storm-research
Hermes 会在同一个 session 里把 4 步串起来,输出直接落到一个 markdown 文件里。比手动复制粘贴快大概 5 倍。
你需要这个 skill 的话,请在评论区留言。
真正的关键:它不会让你跳过 Phase 4(同行评审)。
这一步最容易被人省掉——前 3 步都拿到结论了,谁还想再挨一顿批评?**但这恰恰是 Stanford 论文里明确点名“用来修补 STORM 系统弱点“的关键步骤。**省掉它,你就退化回了“装作多角度其实自欺欺人“的普通 prompt 链。
工具的价值,不是替你做活;是不让你偷懒。
The Persona Block:这套方法是写给谁的
你是会读书的人。你问硬问题。你不想要那种听起来很聪明、实际什么都没说的 200 字总结。
你想真的搞懂一件事。快、有出处、像 Stanford 研究生那样彻底——但不交六年的学费。
如果这就是你,把这篇文章存起来。用这 4 个 prompt。亲眼看看差别。
不舒服的真相
下面这件事,没人愿意大声说出来。
Stanford 团队 2024 年发表了这个方法。论文经过同行评审。代码开源。在线工具免费。整套方法压缩成 4 个 prompt。几乎没有人在用它。
我们正处在一个 18 个月的窗口期。学会用 AI 做真正研究的人,会在思考质量上碾压那些没学会的人。不是因为他们更聪明——是因为他们在跑 5 视角扫描、矛盾地图、综合简报和同行评审,而别人还在读 Google 搜索结果的第一条。
18 个月后,这一整套工作流会被每个工具默认内置进去。优势会消失。
今天,它还是一个明摆着的秘密。
挑一个你最需要研究的话题。打开 Claude。粘上 Prompt 1。
5 分钟以后,你对这件事的理解,会超过那些花了好几天读资料的人。
Prompt 都在上面。方法 Stanford 已经验证过。剩下的就看你了。
编译说明:本文编译自 Nav Toor(@heynavtoor)在 X 上发表的文章 The Stanford STORM Method: How to Make Claude Research Like a PhD in Minutes(2026-06)。文中 4 个 prompt 为 Nav 原文的中文意译——保留原版的提问结构与逻辑(5 视角 / 矛盾地图的 5 个问题 / 综合简报的 5 项产出 / 同行评审的 5 项检查),按地道中文短句重写,术语首次出现时附英文原文。我们(JumpX)还把这套方法封装成了 Hermes Agent 的可复用 skill storm-research,供日常研究使用。STORM 论文 (Shao et al., NAACL 2024) 与 Stanford 官方实现见本文末「合集卡」与下方致谢。
致谢与来源:
-
原文作者:Nav Toor(@heynavtoor)
-
STORM 论文:Shao et al., “Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models”, NAACL 2024
-
Stanford 官方实现:stanford-oval/storm(GitHub, MIT 协议)
-
在线 Demo:storm.genie.stanford.edu(免费、免注册)
-
Hermes Agent:由 Nous Research 出品的开源 Agent 框架
相似文章
@JyNong26: https://x.com/JyNong26/status/2068558060759732494
文章介绍斯坦福STORM方法,通过四个提示词实现多视角AI辅助研究,能产出高质量研究简报,显著提升研究深度和效率。
@FinanceYF5: Stanford STORM方法 1/ 谁在错误使用 Claude 大多数人把 Claude 当搜索框:问一句,拿答案,关掉。 斯坦福 STORM 的启发是:让 AI 像研究员一样,从多个角度拆问题。
介绍Stanford STORM方法,提倡将Claude视为研究员而非搜索框,从多角度拆解问题以提升AI使用效果。
@FrankFred834567: 斯坦福这套STORM研究法,在学术圈火了快两年了。 但直到Nav把它拆成4个提示词放进Claude,它才真正变成普通人也能用的研究工具。 核心逻辑其实不复杂:让AI从5个独立视角看同一个问题。 比你自己搜一个月有用得多。 下次写深度内容就…
斯坦福的STORM研究法被Nav拆成4个提示词放进Claude,使普通人也能通过AI从5个独立视角分析问题,提升深度内容写作效率。
@AIExplorerTim: 突破:Claude 现在可以像斯坦福博士生一样进行研究。 这里有 6 个疯狂的 Claude 提示词, 可在几分钟内将 40+ 篇研究论文 转化为结构化文献综述、知识图谱和研究空白。 (保存这个)
发布了一套6个Claude提示词,能够快速将40+篇研究论文转化为结构化文献综述、知识图谱和研究空白分析,提升研究效率。
@vintcessun: 终于有人把科研AI辅助那条断头路修通了。写论文、做文献报告、出仿真图再到答辩PPT,过去每一步都得手动倒腾数据和复制结果,现在三个Skill把全流程串起来了——从scientific-toolkit算数据出图,直接喂给research-w…
报道一个科研AI辅助工具,通过三个Skill(scientific-toolkit、research-writing、office-academic)打通科研全流程,从数据计算到论文写作再到PPT制作,支持在Claude Code和Codex中一键安装,中文优先。