面向 Claude Code 的学术研究技能
摘要
一套为 Claude Code 设计的插件套件,协助学术研究者在从研究到发表的全流程中提供支持,强调人类在环(human-in-the-loop)的完整性校验和风格校准。
暂无内容
查看缓存全文
缓存时间: 2026/05/10 15:43
Imbad0202/academic-research-skills 来源: https://github.com/Imbad0202/academic-research-skills # 适用于 Claude Code 版本的学术研究技能 (https://github.com/Imbad0202/academic-research-skills/releases/tag/v3.7.0) 许可协议: CC BY-NC 4.0 (https://creativecommons.org/licenses/by-nc/4.0/) 赞助 (https://buymeacoffee.com/crucify020v) 繁體中文版 一套全面的适用于学术研究的 Claude Code 技能工具集,覆盖从研究到发表的完整流程。 30秒内完成安装 (Claude Code CLI / VS Code / JetBrains, v3.7.0+): text /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills 然后尝试使用 /ars-plan 通过苏格拉底式对话梳理你的论文结构,或者跳转到 快速安装 查看前置条件和传统的符号链接安装流程。 > AI 是你的副驾驶,而非飞行员。 本工具不会代你撰写论文。它负责处理繁琐的工作——查找参考文献、格式化引文、验证数据、检查逻辑一致性——以便你能专注于真正需要动脑筋的部分:定义问题、选择方法、解读数据含义,以及撰写“我认为……”之后的句子。 > > 与“人类化重写器”不同,本工具不帮你掩饰使用 AI 的事实。它帮助你写得更好。风格校准(Style Calibration)通过过往作品学习你的声音;写作质量检查(Writing Quality Check)捕捉那些让行文显得机器生成的模式。目标是提升质量,而非作弊。 ### 为什么是“人在回路”(human-in-the-loop),而非全自动? Lu 等人(2026, Nature 651:914-919)构建了 AI Scientist —— 首个完全自主的 AI 研究系统,其论文通过顶级机器学习会议(ICLR 2025 研讨会,得分 6.33/10,高于研讨会平均分 4.87)的双盲同行评审。其局限性部分列举了任何全自动 AI 研究流程所继承的故障模式:实现错误、结果幻觉、捷径依赖、将错误重构为洞察、方法论伪造、框架锁定(frame-lock)、引文幻觉。 ARS 建立在这样一个前提之上:由 AI 辅助的人类研究人员比单独使用任何一方更能避免这些故障模式。第二阶段(Stage 2.5)和第四阶段(Stage 4.5)的完整性网关运行七项阻断清单(参见 academic-pipeline/references/ai_research_failure_modes.md);审稿人提供一种可选的校准模式,可根据用户提供的黄金标准集测量其自身的漏报率(FNR)和误报率(FPR)。 v3.3 版本灵感来源于 PaperOrchestra (https://arxiv.org/abs/2604.05018)(Song, Song, Pfister & Yoon, 2026, Google):Semantic Scholar API 验证、防泄漏协议、VLM 图表验证以及得分轨迹追踪。 — ## 架构与流程 👉 docs/ARCHITECTURE.md —— 完整流程视图:流程图、分阶段矩阵、数据访问流、技能依赖图、质量网关及模式列表。该架构文档取代了此前在此处 sprawling 的流程描述。关于哪些阶段运行什么内容的所有信息现在都集中在一个地方。 ## 快速安装 前置条件 - Claude Code (https://claude.ai/install.sh)(最新版;插件打包需要较新版本) - 导出 ANTHROPIC_API_KEY,或在首次运行 claude 时设置 - 可选: Pandoc(用于生成 DOCX),tectonic + 思源宋体 TC(用于生成 APA 7.0 PDF)(若无上述工具,Markdown 输出仍可使用) 插件安装(v3.7.0+,推荐): text /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills 验证是否生效: 运行 /ars-plan 并描述你正在撰写的论文 —— ARS 将启动苏格拉底式对话以映射章节结构。若只想进行单次测试,可尝试 /ars-lit-review "your topic"。 👉 docs/SETUP.md —— 完整指南:安装 Claude Code,设置 API 密钥,可选安装 Pandoc/tectonic 以生成 DOCX/PDF,跨模型验证(ARS_CROSS_MODEL),以及五种安装方法(插件、项目技能、全局技能、claude.ai 项目、仓库克隆)。 ## 性能与成本 👉 docs/PERFORMANCE.md —— 各模式的 Token 预算、完整流程估算(约 1.5 万字论文需 $4–6),以及推荐的 Claude Code 设置(跳过权限;可选 Agent 团队)。 ## 指南与文章 - 学术写作不应是独角戏 (https://open.substack.com/pub/edwardwu223235/p/academic-writing-shouldnt-be-a-solo?r=4dczl&utm_medium=ios) —— 完整流程演练(英文) - 學術寫作不該是一個人的事:一套開源 AI 協作工具如何改變研究者的工作流 (https://open.substack.com/pub/edwardwu223235/p/ai?r=4dczl&utm_medium=ios) —— 完整使用指南(繁體中文) — ## 功能一览 - 深度研究(Deep Research) —— 13 智能体研究团队,具备苏格拉底引导模式、PRISMA 系统综述、意图检测、对话健康监控、可选跨模型决策辅助(DA)、Semantic Scholar API 验证。 - 学术论文(Academic Paper) —— 12 智能体论文写作,具备风格校准、写作质量检查、LaTeX 强化、可视化、修订辅导、引文转换、防泄漏协议及 VLM 图表验证。 - 学术论文审稿人(Academic Paper Reviewer) —— 7 智能体多视角同行评审,采用 0–100 质量标准(EIC + 3 位动态审稿人 + 魔鬼代言人),让步阈值协议、攻击强度保留、可选跨模型 DA 批评/校准、修改与回复(R&R)可追溯性矩阵、只读约束。 - 学术流程(Academic Pipeline) —— 10 阶段流程编排器,具备自适应检查点、主张验证、材料护照(Material Passport)、可选 repro_lock、可选跨模型完整性验证、对话中途强化及得分轨迹追踪。 - 数据访问级别元数据 (v3.3.2+) —— 每项技能均声明 data_access_level(raw / redacted / verified_only);由 scripts/check_data_access_level.py 强制执行。该模式借鉴自 Anthropic 的 automated-w2s-researcher (2026)。参见 shared/ground_truth_isolation_pattern.md。 - 任务类型标注 (v3.3.2+) —— 每项技能均声明 task_type(open-ended 或 outcome-gradable)。当前所有 ARS 技能均为 open-ended。 - 基准报告模式 (v3.3.5+) —— 用于诚实基准比较的 JSON Schema + Lint。参见 shared/benchmark_report_pattern.md。 - 产物可复现性锁定文件 (v3.3.5+) —— 材料护照上的可选 repro_lock 子块。配置文档,非回放保证 —— LLM 输出不具备字节级可复现性。参见 shared/artifact_reproducibility_pattern.md。 — ## 展示:真实流程输出 查看来自真实 10 阶段流程运行的完整产物 —— 同行评审报告、完整性验证报告及最终论文: 浏览所有流程产物 → | 产物 | 描述 | |—|—| | 最终论文 (英文) | APA 7.0 格式,LaTeX 编译 | | 最终论文 (中文) | 中文版,APA 7.0 | | 完整性报告 — 审稿前 | 阶段 2.5:发现 15 个伪造引用 + 3 个统计错误 | | 完整性报告 — 最终 | 阶段 4.5:确认零回归 | | 同行评审第一轮 | EIC + 3 位审稿人 + 魔鬼代言人 | | 重新评审 | 修订后的验证 | | 同行评审第二轮 | 跟进评审 | | 回复审稿人 | 作者逐点回复 | | 发表后审计报告 | 独立全引用审计:发现 3 轮完整性检查遗漏的 21/68 个问题 | — ## 配套工具:实验代理 如果你的研究涉及在写作前运行实验(代码或人类研究),Experiment Agent (https://github.com/Imbad0202/experiment-agent) 技能填补了 ARS 阶段 1(研究)和阶段 2(写作)之间的空白。 ARS 阶段 1 研究 → RQ 简报 + 方法论蓝图 ↓ experiment-agent → 运行/管理实验 → 验证结果 ↓ ARS 阶段 2 写作 → 使用验证过的实验结果撰写论文 它做什么:执行代码实验(Python、R 等)并实时监控,使用 IRB 伦理清单管理人类研究协议,通过 11 种谬误检测解释统计数据,并验证可复现性。 如何协同使用:在阶段 1 后暂停 ARS 流程,在单独的 experiment-agent 会话中运行实验,然后将结果(附带材料护照)带回 ARS 阶段 2。ARS 无需任何修改。参见 experiment-agent README (https://github.com/Imbad0202/experiment-agent) 获取安装说明。 — ## 使用指南 ### 快速开始 # 启动完整研究流程 你:“我想写一篇关于 AI 对高等教育质量保证影响的研究论文” # 从苏格拉底引导开始 你:“指导我研究教育评估中的 AI” # 通过引导规划撰写论文 你:“指导我撰写关于人口减少的论文” # 评审现有论文 你:“评审这篇论文”(然后提供论文) # 检查流程状态 你:“status” ### 单项技能 #### 深度研究(7 种模式) “研究 AI 对高等教育的影响” → 完整模式 “给我一份关于 X 的简短简报” → 快速模式 “对 X 进行基于 PRISMA 的系统综述” → 系统综述模式 “指导我研究 X” → 苏格拉底模式(引导) “事实核查这些主张” → 事实核查模式 “对 X 进行文献综述” → 文献综述模式 “评审这篇论文的研究质量” → 评审模式 #### 学术论文(10 种模式) “写一篇关于 X 的论文” → 完整模式 “指导我撰写论文” → 规划模式(引导) “构建论文大纲” → 仅大纲模式 “我有一个草稿,以下是审稿意见” → 修订模式 “将这些审稿意见解析为路线图” → 修订教练模式 “为这篇论文写摘要” → 仅摘要模式 “将其转化为文献综述论文” → 文献综述模式 “转换为 LaTeX” / “将引文转换为 IEEE” → 格式转换模式 “检查引文” → 引文检查模式 “为 NeurIPS 生成 AI 披露声明” → 披露模式 #### 学术论文审稿人(6 种模式) “评审这篇论文” → 完整模式(EIC + R1/R2/R3 + 魔鬼代言人) “快速评估这篇论文” → 快速模式 “指导我改进这篇论文” → 引导模式 “检查方法论” → 方法论聚焦模式 “验证修订” → 重新评审模式 “根据我的黄金标准集校准此审稿人” → 校准模式 #### 学术流程(编排器) “我想写一篇完整的研究论文” → 从阶段 1 开始的完整流程 “我已经有论文了,请评审” → 阶段 2.5 中途进入(先进行完整性检查) “我收到了审稿意见” → 阶段 4 中途进入 > 流程以 阶段 6:流程总结 结束 —— 自动生成包含六维协作质量评估(1–100 分)的论文创建过程记录。 ### 支持的语言 - 繁体中文 —— 用户使用中文写作时的默认语言 - 英语 —— 用户使用英语写作时的默认语言 - 学术论文支持双语摘要(中文 + 英文) > 使用其他语言? 苏格拉底模式(深度研究)和规划模式(学术论文)使用 基于意图的激活 —— 它们检测你请求的含义,而非特定关键词。这意味着它们在 任何语言 中无需修改即可工作。 > > 然而,通用 触发关键词 部分(决定技能是否被激活)仍列出英语和繁体中文关键词。如果你发现技能在你所使用的语言中激活不可靠,可以在每个 SKILL.md 文件的 ### Trigger Keywords 部分添加你语言的关键词,以提高匹配置信度。 ### 支持的引文格式 - APA 7.0(默认,包括中文引文规则) - Chicago(注释与作者-日期) - MLA - IEEE - Vancouver ### 支持的论文结构 - IMRaD(实证研究) - 主题文献综述 - 理论分析 - 案例研究 - 政策简报 - 会议论文 — ## 技能详情 各智能体职责及各阶段产物现位于 docs/ARCHITECTURE.md。版本号在此锚定,以便发布元数据集中管理。 ### 深度研究 (v2.8) 13 智能体研究团队。模式:完整、快速、评审、文献综述、事实核查、苏格拉底、系统综述。完整智能体名单及产物:参见 ARCHITECTURE.md §3。 ### 学术论文 (v3.0) 12 智能体论文写作流程。模式:完整、规划、仅大纲、修订、修订教练、仅摘要、文献综述、格式转换、引文检查、披露。输出:MD + DOCX(通过 Pandoc,若可用)+ LaTeX(APA 7.0 apa7 类 / IEEE / Chicago)→ 通过 tectonic 生成 PDF。完整智能体名单及各阶段职责:参见 ARCHITECTURE.md §3。 ### 学术论文审稿人 (v1.8) 7 智能体多视角评审,采用 0-100 质量标准。模式:完整、重新评审、快速、方法论聚焦、引导、校准。决策映射: ≥80 接受,65-79 小修,50-64 大修,<50 拒稿。首轮评审团队与狭义重新评审团队边界:参见 ARCHITECTURE.md §3 阶段 3 / 阶段 3’。 ### 学术流程 (v3.7) 10 阶段编排器,具备完整性验证、两阶段评审、苏格拉底辅导及协作评估。流程保证:每个阶段均需用户确认检查点;完整性验证(阶段 2.5 + 4.5)不可跳过;R&R 可追溯性矩阵(模式 11)独立验证作者的修订主张。v3.4 在阶段 2.5 / 4.5 增加了合规代理(PRISMA-trAIce + RAISE)。v3.5 在每个 FULL/SLIM 检查点及流程完成时增加了 协作深度观察器(collaboration_depth_agent,仅供参考 —— 从不阻断)。强制性完整性网关(2.5 / 4.5)明确跳过观察器,以免稀释合规检查。基于 Wang & Zhang (2026), IJETHE 23:11。各阶段矩阵(含智能体、产物及网关):参见 ARCHITECTURE.md §3。 — ## v3.0 优化:我们发现了 AI 的哪些结构性局限 ### 发生了什么 在使用 ARS 撰写一篇关于高等教育中 AI 的反思文章时,我遇到了三个无论多少提示词工程都无法解决的结构性问题: 1. 框架锁定(Frame-lock):我要求 AI 就其自身论点进行魔鬼代言人辩论。它照做了 —— 四轮,每一轮都比前一轮更精炼。但每一轮都停留在我设定的框架内。魔鬼代言人攻击论点,从未攻击前提。它从未问“我们是否在讨论正确的问题?”这与导致 v2.7 压力测试中 31% 引文错误率的模式相同:验证 AI 和生成 AI 共享相同的认知框架。 2. 反驳下的阿谀奉承(Sycophancy under pushback):每次我挑战魔鬼代言人的攻击时,它都让步太快。它撤回发现的 speed 比发起攻击还快。模型的训练奖励对话和谐 —— 因此“用户反驳”被视为攻击错误的证据,而往往这只是意味着用户很坚持。 3. 意图误检测:当我仍在探索时,苏格拉底导师不断试图收敛并产出成果(“要我写下来吗?”)。它无法区分“用户想要深入的哲学讨论”与“用户想要 RQ 简报”。两者看起来都像参与,但需要相反的 AI 行为。 ### 我们改了什么(v3.0) 魔鬼代言人 —— 让步阈值协议(deep-research + academic-paper-reviewer) - 魔鬼代言人现在必须在回应前对每次反驳进行 1-5 分评分 - 仅在评分 ≥4 时允许让步(反驳直接针对核心攻击并提供证据) - 评分 ≤3:坚持立场并重申原始攻击 - 抗
相似文章
@DataChaz: 有人刚刚为 Claude Code 发布了一套完整的10阶段学术研究流程。它不会替你写论文,但会…
Claude Code 的一个全新开源插件提供了一套10阶段的学术研究流程,能够处理参考文献搜集、引用验证和模拟同行评审,同时保持用户的写作风格。
@DivyanshT91162: Claude Code 刚刚获得了学术研究超级能力。有人构建了一个 10 阶段的 AI 研究系统,它不仅“撰写论文”……
一款专为 Claude Code 设计的全新开源 10 阶段 AI 研究系统插件,自动化了文献综述、引用验证和同行评审模拟。它通过事实核查和模拟批判性反馈,声称能够以极低的成本生成高质量的学术初稿。
@GoSailGlobal: Claude Code 102 针对学术研究者 Mushtaq Bilal 博士的 Claude Code 102 出来了 第一篇 4M+ 阅读 / 这一篇接得很硬 他的核心论点:Claude Code 完全可以当成「长期研究项目」的工作…
The article details Dr. Mushtaq Bilal's guide on using Claude Code as a workflow engine for long-term academic research, outlining five key modules including file organization, subagents, and automation hooks.
@MushtaqBilalPhD: https://x.com/MushtaqBilalPhD/status/2057786613795639582
一份全面的入门指南,面向非技术背景的学术研究人员,介绍如何使用Claude Code,涵盖安装、项目组织以及无需编程技能即可自动化研究任务。
我构建了一个开源Claude Code插件,强制实施规范驱动的工作流(访谈→规范→计划→任务→代码)
介绍Specsmith,一个用于Claude Code的开源插件,强制实施规范驱动的工作流(访谈、规范、计划、任务、代码),以减少歧义并提高代码质量,目前处于早期v0.1版本。