@Stephen4171127: https://x.com/Stephen4171127/status/2068955415778369751

X AI KOLs Timeline 工具

摘要

本文介绍了Stanford的STORM研究方法,并提供了4个Prompt,让用户能在Claude中复制多视角研究流程,5分钟内生成博士级别的研究简报。

https://t.co/Ny7r0oXqU8
查看原文
查看缓存全文

缓存时间: 2026/06/23 01:57

Stanford 偷偷开源了一套研究方法,4 个 Prompt 让 Claude 顶博士

[译文]Stanford 偷偷开源了一套研究方法,4 个 Prompt 让 Claude 顶博士

大多数人把 Claude 当搜索框用。问一句、看一眼、关页面。

最强的那个功能,他们一直没打开过。

Stanford 做过一套叫 STORM 的研究方法。同行评审实验里,它产出的文章比下一名方法组织度高 25%。开源、免费,几乎没人知道——同样的思路,你用 4 个 prompt 就能在 Claude 里跑起来

不需要装软件。不需要 GitHub。不需要任何配置。复制粘贴就行。

5 分钟以后,你对一个话题的理解,会超过那些花了好几天读资料的人。

下面是完整方法。

Phase 1: STORM 到底是什么

STORM 的全称是 Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking(基于检索与多视角问询的主题大纲合成),由 Stanford OVAL Lab 在 NAACL 2024 上发表。

在线版可以直接在 storm.genie.stanford.edu 上用。免费、免注册。输入一个话题,看它当场写出一篇带引用的文章。

YouTube 上有一段 12 分钟的官方讲解视频(搜 “STORM by Stanford”),值得看一次。

完整源码托管在 github.com/stanford-oval/storm,MIT 协议,29k+ stars,你也可以拉到自己机器上跑。

但真正的彩蛋在这里:你根本不需要安装任何东西。

Stanford 的方法本质上是一种思考方式。你可以用 4 个复制粘贴的 prompt,在 Claude 里跑出同样的思考流程。

文章剩下的部分,就是这 4 个 prompt。

Phase 2: 为什么单个 Prompt 永远不够

你问 Claude“讲讲 X“,拿回来的永远是多数派视角。最常见的框架。最表层的共识。

你拿不到的是:

  • 每天和 X 打交道的从业者(Practitioner)

  • 认为整个领域方向错了的怀疑者(Skeptic)

  • 沿着钱流走的经济学家(Economist)

  • 见过类似模式的历史学家(Historian)

  • 真正读过论文的学术研究者(Academic)

这 5 个声音看到的是完全不同的东西。

**博士生(PhD)做研究就是这样的。**他们不问一个问题,问五个。

Stanford 的论文用数据证明了这件事:多视角构建的文章,比单 prompt 方法组织度高 25%,覆盖广度宽 10%。这就是 STORM 的全部突破——多视角问询能抓出单 prompt 永远看不见的盲区。

博士级别的研究工作,通常需要一个人花 40 到 60 小时阅读。大多数人匀不出这个时间。STORM 把它压缩了一次。下面这 4 个 prompt 把它再压缩一次。总共 5 分钟。

Phase 3: Prompt 1——多视角扫描

这是整个方法的核心。

直接粘进 Claude,把【你的话题】那一行换成你要研究的内容。

我需要研究【你的话题】。

请模拟 5 种不同的专家视角分析这个话题:

  1. 从业者(The Practitioner):每天和它打交道。 学者们错过了哪些只有从业者才知道的事? 有哪些现实层面的考虑通常被忽略?

  2. 学者(The Academic):研究这个领域多年。 同行评审的证据实际上是怎么说的? 证据在哪些地方与流行看法相矛盾?

  3. 怀疑者(The Skeptic):认为主流观点是错的。 最有力的反驳论点是什么? 支持者们刻意忽略了哪些证据?

  4. 经济学家(The Economist):追踪资金流向。 谁从当前的叙事中获利? 什么样的财务激励在塑造这项研究?

  5. 历史学家(The Historian):见过类似的模式。 历史上有什么相似的先例? 那些先例最终的走向能教会我们什么?

对每一种视角,给我:

  • 用 2 句话概括他/她的核心立场
  • 支撑该立场最有力的证据
  • 这一视角能告诉我、其他视角告诉不了的那一件事

你会拿到什么:同一个话题的 5 种截然不同的解读。从业者看见学术者忽略的,怀疑者挑战从业者默认的前提,经济学家挖出学术者不在意的利益结构,历史学家给出经济学家看不见的时间维度。

60 秒的工作量,抓住的是单 prompt 永远找不到的东西。

Phase 4: Prompt 2——矛盾地图

接下来让 Claude 找出 5 个声音在哪里打架

打架的地方,就是真理藏身的地方。

基于上面 5 种视角,请绘制一张「矛盾地图」:

  1. 哪些视角之间出现了直接对立?把每对冲突连同它们各自的具体主张一起列出来。

  2. 哪一种视角的证据最硬?哪一种最弱?为什么?

  3. 如果只能回答一个问题就能化解最大的矛盾,那会是什么问题?

  4. 5 种视角全部认可的事实是什么? (这通常就是真相。连对手都点头的事,最可靠。)

  5. 5 种视角全都没提到的话题是什么? (这就是整个领域的盲点。往往是最有价值的发现。)

你会拿到什么:一张地图,标清楚专家在哪些地方分歧、为什么分歧。

大多数人会跳过这一步。但这一步,正是把表层理解和真懂的人区分开来的那道坎。

如果 5 个视角都一致,那它大概率是真的。 如果没有一个视角讨论过某件事,那你刚刚发现了整个领域的盲区。

Phase 5: Prompt 3——综合简报

让 Claude 把一切汇总成一份研究简报。

请把 5 种视角 + 矛盾地图综合成一份研究简报:

  1. 一段话总结:把这个话题讲给一位只有 60 秒、但需要细节而非头条的 CEO 听。

  2. 5 个关键发现:我现在掌握的最重要的事,按可靠性排序。每条标注:哪些视角支持、哪些视角挑战。

  3. 隐藏的关联:5 种视角放在一起看才能看出来的、一个不显而易见的发现间联系。

  4. 可执行的洞见:基于全部证据,一位身处【你的角色】的人应该具体怎么做才不一样?要具体。

  5. 前沿问题:如果能回答这一个问题,就会彻底改变我们对该话题的理解——它是什么?

你会拿到什么:一份没有任何单一专家能独立写出来的简报。它顾及到每一个角度、点出所有矛盾、对可靠性做了分级、最后落在一个具体动作上。

这是博士生 48 小时才能交出来的东西。你 90 秒就拿到了。

Phase 6: Prompt 4——同行评审

STORM 有一个公开的弱点。这是 Stanford 自己的研究人员标出来的——系统不会自我批判。来源偏倚(Source Bias)和事实错配(Fact Misassociation)会偷偷溜进来。

这个 prompt 就是用来堵这个洞的——让 Claude 给自己的作业打分。

现在请同行评审你自己刚才写的那份研究简报:

  1. 置信度评分(Confidence Scores):把 5 个关键发现按 1-10 分打分(可靠性),并解释每个分数的理由。

  2. 最薄弱环节(Weakest Link):哪条主张你最没把握?需要哪些具体信息才能验证它?

  3. 偏见检查(Bias Check):在综合时,哪一种视角可能被过度采纳?是否有一个声音盖过了其他声音?

  4. 遗漏的视角(Missing Perspective):是否还有第 6 种视角,加入后会改变结论?

  5. 总体评分(Overall Grade):如果一位 Stanford 教授来评审这份简报,会打几分,为什么?他/她会让你改哪里?

你会拿到什么:对你自己研究的一次诚实复盘。哪些主张站得住、哪些站不住、哪些角度漏了、哪些偏见在里面。

真正的同行评审要走几个月流程。你 60 秒就走完了一遍。

Phase 7: 5 分钟工作流

第 1 分钟:跑 Prompt 1。你得到 5 个专家视角。

第 2-3 分钟:跑 Prompt 2。你得到一张矛盾地图。

第 3-4 分钟:跑 Prompt 3。你得到一份研究简报。

第 5 分钟:跑 Prompt 4。你知道哪些可信、哪些不可信。

总耗时 5 分钟。产出:一份多视角简报 + 矛盾分析 + 综合判断 + 一个具体动作 + 一个可靠性评级。

一个博士生手工做出同等质量的工作,需要 40 到 60 小时。不是因为他慢——是因为“从 5 个角度读、画矛盾、综合、自我批判“这套动作,对一个人类大脑来说,真的就是 40 小时的活。

Phase 8: 7 个可以从今天开始用的场景

1. 写任何文章或报告之前。跑一遍 4 个 prompt。你的稿子会覆盖到别人想都没想过的角度。

2. 做重大商业决策之前。把 5 个视角都拿到。从业者告诉你现实里什么能跑、怀疑者告诉你哪里会翻车、经济学家告诉你这笔钱最后流进了谁的口袋。

3. 面试之前。5 分钟从 5 个角度研究目标公司。从业者视角给你内部人才听得懂的语言,怀疑者视角给你能问出真问题的尖刀。走进会议室时,你比屋里任何人都更有准备。

4. 投资之前。牛市派、熊市派、历史先例、激励链、学术证据——5 分钟全到位。矛盾地图告诉你真正的风险藏在哪。

5. 学一门新技能之前。从 5 个角度给整个领域画地图。从业者告诉你先学什么、学术者告诉你底层原理、怀疑者告诉你哪些是过度炒作。你跳过所有噪音。

6. 谈判之前。从 5 个视角研究对手。理解他们的激励、弱点、过往行为。你走进去就带着结构性优势。

7. 任何演讲之前。在你的话题上跑一遍 STORM。你的 slides 会在观众提问之前就答好他们的疑问。你的 Q&A 环节会从容得不像在临场

Phase 9: 我们怎么把它做成日用工具

看完上面四步,你可能在想:每次都重新粘 4 个 prompt 也挺烦的。

我们(JumpX)的工作站跑着 Hermes Agent,已经把这套方法封装成了一个 skill。研究一个新话题时,一行命令就能跑完:

hermes chat -q “用 storm-research 研究:2026 年小型本地推理模型是否值得创业公司投入” -s storm-research

Hermes 会在同一个 session 里把 4 步串起来,输出直接落到一个 markdown 文件里。比手动复制粘贴快大概 5 倍。

你需要这个 skill 的话,请在评论区留言。

真正的关键:它不会让你跳过 Phase 4(同行评审)。

这一步最容易被人省掉——前 3 步都拿到结论了,谁还想再挨一顿批评?**但这恰恰是 Stanford 论文里明确点名“用来修补 STORM 系统弱点“的关键步骤。**省掉它,你就退化回了“装作多角度其实自欺欺人“的普通 prompt 链。

工具的价值,不是替你做活;是不让你偷懒

The Persona Block:这套方法是写给谁的

你是会读书的人。你问硬问题。你不想要那种听起来很聪明、实际什么都没说的 200 字总结。

你想真的搞懂一件事。快、有出处、像 Stanford 研究生那样彻底——但不交六年的学费。

如果这就是你,把这篇文章存起来。用这 4 个 prompt。亲眼看看差别。

不舒服的真相

下面这件事,没人愿意大声说出来。

Stanford 团队 2024 年发表了这个方法。论文经过同行评审。代码开源。在线工具免费。整套方法压缩成 4 个 prompt。几乎没有人在用它。

我们正处在一个 18 个月的窗口期。学会用 AI 做真正研究的人,会在思考质量上碾压那些没学会的人。不是因为他们更聪明——是因为他们在跑 5 视角扫描、矛盾地图、综合简报和同行评审,而别人还在读 Google 搜索结果的第一条。

18 个月后,这一整套工作流会被每个工具默认内置进去。优势会消失。

今天,它还是一个明摆着的秘密。

挑一个你最需要研究的话题。打开 Claude。粘上 Prompt 1。

5 分钟以后,你对这件事的理解,会超过那些花了好几天读资料的人。

Prompt 都在上面。方法 Stanford 已经验证过。剩下的就看你了。

编译说明:本文编译自 Nav Toor(@heynavtoor)在 X 上发表的文章 The Stanford STORM Method: How to Make Claude Research Like a PhD in Minutes(2026-06)。文中 4 个 prompt 为 Nav 原文的中文意译——保留原版的提问结构与逻辑(5 视角 / 矛盾地图的 5 个问题 / 综合简报的 5 项产出 / 同行评审的 5 项检查),按地道中文短句重写,术语首次出现时附英文原文。我们(JumpX)还把这套方法封装成了 Hermes Agent 的可复用 skill storm-research,供日常研究使用。STORM 论文 (Shao et al., NAACL 2024) 与 Stanford 官方实现见本文末「合集卡」与下方致谢。

致谢与来源:

  • 原文作者:Nav Toor(@heynavtoor)

  • STORM 论文:Shao et al., “Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models”, NAACL 2024

  • Stanford 官方实现:stanford-oval/storm(GitHub, MIT 协议)

  • 在线 Demo:storm.genie.stanford.edu(免费、免注册)

  • Hermes Agent:由 Nous Research 出品的开源 Agent 框架

相似文章

@FrankFred834567: 斯坦福这套STORM研究法,在学术圈火了快两年了。 但直到Nav把它拆成4个提示词放进Claude,它才真正变成普通人也能用的研究工具。 核心逻辑其实不复杂:让AI从5个独立视角看同一个问题。 比你自己搜一个月有用得多。 下次写深度内容就…

X AI KOLs Timeline

斯坦福的STORM研究法被Nav拆成4个提示词放进Claude,使普通人也能通过AI从5个独立视角分析问题,提升深度内容写作效率。

@vintcessun: 终于有人把科研AI辅助那条断头路修通了。写论文、做文献报告、出仿真图再到答辩PPT,过去每一步都得手动倒腾数据和复制结果,现在三个Skill把全流程串起来了——从scientific-toolkit算数据出图,直接喂给research-w…

X AI KOLs Timeline

报道一个科研AI辅助工具,通过三个Skill(scientific-toolkit、research-writing、office-academic)打通科研全流程,从数据计算到论文写作再到PPT制作,支持在Claude Code和Codex中一键安装,中文优先。