面向 Claude Code 的学术研究技能

Hacker News Top 2026/05/10 13:42 工具

摘要

一套为 Claude Code 设计的插件套件，协助学术研究者在从研究到发表的全流程中提供支持，强调人类在环（human-in-the-loop）的完整性校验和风格校准。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/05/10 15:43

Imbad0202/academic-research-skills 来源: https://github.com/Imbad0202/academic-research-skills # 适用于 Claude Code 版本的学术研究技能 (https://github.com/Imbad0202/academic-research-skills/releases/tag/v3.7.0) 许可协议: CC BY-NC 4.0 (https://creativecommons.org/licenses/by-nc/4.0/) 赞助 (https://buymeacoffee.com/crucify020v) 繁體中文版一套全面的适用于学术研究的 Claude Code 技能工具集，覆盖从研究到发表的完整流程。 30秒内完成安装 (Claude Code CLI / VS Code / JetBrains, v3.7.0+)： `text /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills` 然后尝试使用 `/ars-plan` 通过苏格拉底式对话梳理你的论文结构，或者跳转到快速安装查看前置条件和传统的符号链接安装流程。 > AI 是你的副驾驶，而非飞行员。本工具不会代你撰写论文。它负责处理繁琐的工作——查找参考文献、格式化引文、验证数据、检查逻辑一致性——以便你能专注于真正需要动脑筋的部分：定义问题、选择方法、解读数据含义，以及撰写“我认为……”之后的句子。 > > 与“人类化重写器”不同，本工具不帮你掩饰使用 AI 的事实。它帮助你写得更好。风格校准（Style Calibration）通过过往作品学习你的声音；写作质量检查（Writing Quality Check）捕捉那些让行文显得机器生成的模式。目标是提升质量，而非作弊。 ### 为什么是“人在回路”（human-in-the-loop），而非全自动？ Lu 等人（2026, Nature 651:914-919）构建了 AI Scientist —— 首个完全自主的 AI 研究系统，其论文通过顶级机器学习会议（ICLR 2025 研讨会，得分 6.33/10，高于研讨会平均分 4.87）的双盲同行评审。其局限性部分列举了任何全自动 AI 研究流程所继承的故障模式：实现错误、结果幻觉、捷径依赖、将错误重构为洞察、方法论伪造、框架锁定（frame-lock）、引文幻觉。 ARS 建立在这样一个前提之上：由 AI 辅助的人类研究人员比单独使用任何一方更能避免这些故障模式。第二阶段（Stage 2.5）和第四阶段（Stage 4.5）的完整性网关运行七项阻断清单（参见 `academic-pipeline/references/ai_research_failure_modes.md`）；审稿人提供一种可选的校准模式，可根据用户提供的黄金标准集测量其自身的漏报率（FNR）和误报率（FPR）。 v3.3 版本灵感来源于 PaperOrchestra (https://arxiv.org/abs/2604.05018)（Song, Song, Pfister & Yoon, 2026, Google）：Semantic Scholar API 验证、防泄漏协议、VLM 图表验证以及得分轨迹追踪。 — ## 架构与流程 👉 docs/ARCHITECTURE.md —— 完整流程视图：流程图、分阶段矩阵、数据访问流、技能依赖图、质量网关及模式列表。该架构文档取代了此前在此处 sprawling 的流程描述。关于哪些阶段运行什么内容的所有信息现在都集中在一个地方。 ## 快速安装前置条件 - Claude Code (https://claude.ai/install.sh)（最新版；插件打包需要较新版本） - 导出 `ANTHROPIC_API_KEY`，或在首次运行 `claude` 时设置 - 可选： Pandoc（用于生成 DOCX），tectonic + 思源宋体 TC（用于生成 APA 7.0 PDF）（若无上述工具，Markdown 输出仍可使用）插件安装（v3.7.0+，推荐）： `text /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills` 验证是否生效：运行 `/ars-plan` 并描述你正在撰写的论文 —— ARS 将启动苏格拉底式对话以映射章节结构。若只想进行单次测试，可尝试 `/ars-lit-review "your topic"`。 👉 docs/SETUP.md —— 完整指南：安装 Claude Code，设置 API 密钥，可选安装 Pandoc/tectonic 以生成 DOCX/PDF，跨模型验证（`ARS_CROSS_MODEL`），以及五种安装方法（插件、项目技能、全局技能、claude.ai 项目、仓库克隆）。 ## 性能与成本 👉 docs/PERFORMANCE.md —— 各模式的 Token 预算、完整流程估算（约 1.5 万字论文需 $4–6），以及推荐的 Claude Code 设置（跳过权限；可选 Agent 团队）。 ## 指南与文章 - 学术写作不应是独角戏 (https://open.substack.com/pub/edwardwu223235/p/academic-writing-shouldnt-be-a-solo?r=4dczl&utm_medium=ios) —— 完整流程演练（英文） - 學術寫作不該是一個人的事：一套開源 AI 協作工具如何改變研究者的工作流 (https://open.substack.com/pub/edwardwu223235/p/ai?r=4dczl&utm_medium=ios) —— 完整使用指南（繁體中文） — ## 功能一览 - 深度研究（Deep Research） —— 13 智能体研究团队，具备苏格拉底引导模式、PRISMA 系统综述、意图检测、对话健康监控、可选跨模型决策辅助（DA）、Semantic Scholar API 验证。 - 学术论文（Academic Paper） —— 12 智能体论文写作，具备风格校准、写作质量检查、LaTeX 强化、可视化、修订辅导、引文转换、防泄漏协议及 VLM 图表验证。 - 学术论文审稿人（Academic Paper Reviewer） —— 7 智能体多视角同行评审，采用 0–100 质量标准（EIC + 3 位动态审稿人 + 魔鬼代言人），让步阈值协议、攻击强度保留、可选跨模型 DA 批评/校准、修改与回复（R&R）可追溯性矩阵、只读约束。 - 学术流程（Academic Pipeline） —— 10 阶段流程编排器，具备自适应检查点、主张验证、材料护照（Material Passport）、可选 `repro_lock`、可选跨模型完整性验证、对话中途强化及得分轨迹追踪。 - 数据访问级别元数据 (v3.3.2+) —— 每项技能均声明 `data_access_level`（`raw` / `redacted` / `verified_only`）；由 `scripts/check_data_access_level.py` 强制执行。该模式借鉴自 Anthropic 的 automated-w2s-researcher (2026)。参见 `shared/ground_truth_isolation_pattern.md`。 - 任务类型标注 (v3.3.2+) —— 每项技能均声明 `task_type`（`open-ended` 或 `outcome-gradable`）。当前所有 ARS 技能均为 `open-ended`。 - 基准报告模式 (v3.3.5+) —— 用于诚实基准比较的 JSON Schema + Lint。参见 `shared/benchmark_report_pattern.md`。 - 产物可复现性锁定文件 (v3.3.5+) —— 材料护照上的可选 `repro_lock` 子块。配置文档，非回放保证 —— LLM 输出不具备字节级可复现性。参见 `shared/artifact_reproducibility_pattern.md`。 — ## 展示：真实流程输出查看来自真实 10 阶段流程运行的完整产物 —— 同行评审报告、完整性验证报告及最终论文：浏览所有流程产物 → | 产物 | 描述 | |—|—| | 最终论文 (英文) | APA 7.0 格式，LaTeX 编译 | | 最终论文 (中文) | 中文版，APA 7.0 | | 完整性报告 — 审稿前 | 阶段 2.5：发现 15 个伪造引用 + 3 个统计错误 | | 完整性报告 — 最终 | 阶段 4.5：确认零回归 | | 同行评审第一轮 | EIC + 3 位审稿人 + 魔鬼代言人 | | 重新评审 | 修订后的验证 | | 同行评审第二轮 | 跟进评审 | | 回复审稿人 | 作者逐点回复 | | 发表后审计报告 | 独立全引用审计：发现 3 轮完整性检查遗漏的 21/68 个问题 | — ## 配套工具：实验代理如果你的研究涉及在写作前运行实验（代码或人类研究），Experiment Agent (https://github.com/Imbad0202/experiment-agent) 技能填补了 ARS 阶段 1（研究）和阶段 2（写作）之间的空白。 `ARS 阶段 1 研究 → RQ 简报 + 方法论蓝图 ↓ experiment-agent → 运行/管理实验 → 验证结果 ↓ ARS 阶段 2 写作 → 使用验证过的实验结果撰写论文` 它做什么：执行代码实验（Python、R 等）并实时监控，使用 IRB 伦理清单管理人类研究协议，通过 11 种谬误检测解释统计数据，并验证可复现性。如何协同使用：在阶段 1 后暂停 ARS 流程，在单独的 experiment-agent 会话中运行实验，然后将结果（附带材料护照）带回 ARS 阶段 2。ARS 无需任何修改。参见 experiment-agent README (https://github.com/Imbad0202/experiment-agent) 获取安装说明。 — ## 使用指南 ### 快速开始 `# 启动完整研究流程你：“我想写一篇关于 AI 对高等教育质量保证影响的研究论文” # 从苏格拉底引导开始你：“指导我研究教育评估中的 AI” # 通过引导规划撰写论文你：“指导我撰写关于人口减少的论文” # 评审现有论文你：“评审这篇论文”（然后提供论文） # 检查流程状态你：“status”` ### 单项技能 #### 深度研究（7 种模式） `“研究 AI 对高等教育的影响” → 完整模式 “给我一份关于 X 的简短简报” → 快速模式 “对 X 进行基于 PRISMA 的系统综述” → 系统综述模式 “指导我研究 X” → 苏格拉底模式（引导） “事实核查这些主张” → 事实核查模式 “对 X 进行文献综述” → 文献综述模式 “评审这篇论文的研究质量” → 评审模式` #### 学术论文（10 种模式） “写一篇关于 X 的论文” → 完整模式 “指导我撰写论文” → 规划模式（引导） “构建论文大纲” → 仅大纲模式 “我有一个草稿，以下是审稿意见” → 修订模式 “将这些审稿意见解析为路线图” → 修订教练模式 “为这篇论文写摘要” → 仅摘要模式 “将其转化为文献综述论文” → 文献综述模式 “转换为 LaTeX” / “将引文转换为 IEEE” → 格式转换模式 “检查引文” → 引文检查模式 “为 NeurIPS 生成 AI 披露声明” → 披露模式 #### 学术论文审稿人（6 种模式） `“评审这篇论文” → 完整模式（EIC + R1/R2/R3 + 魔鬼代言人） “快速评估这篇论文” → 快速模式 “指导我改进这篇论文” → 引导模式 “检查方法论” → 方法论聚焦模式 “验证修订” → 重新评审模式 “根据我的黄金标准集校准此审稿人” → 校准模式` #### 学术流程（编排器） `“我想写一篇完整的研究论文” → 从阶段 1 开始的完整流程 “我已经有论文了，请评审” → 阶段 2.5 中途进入（先进行完整性检查） “我收到了审稿意见” → 阶段 4 中途进入` > 流程以阶段 6：流程总结结束 —— 自动生成包含六维协作质量评估（1–100 分）的论文创建过程记录。 ### 支持的语言 - 繁体中文 —— 用户使用中文写作时的默认语言 - 英语 —— 用户使用英语写作时的默认语言 - 学术论文支持双语摘要（中文 + 英文） > 使用其他语言？苏格拉底模式（深度研究）和规划模式（学术论文）使用基于意图的激活 —— 它们检测你请求的含义，而非特定关键词。这意味着它们在任何语言中无需修改即可工作。 > > 然而，通用 `触发关键词` 部分（决定技能是否被激活）仍列出英语和繁体中文关键词。如果你发现技能在你所使用的语言中激活不可靠，可以在每个 `SKILL.md` 文件的 `### Trigger Keywords` 部分添加你语言的关键词，以提高匹配置信度。 ### 支持的引文格式 - APA 7.0（默认，包括中文引文规则） - Chicago（注释与作者-日期） - MLA - IEEE - Vancouver ### 支持的论文结构 - IMRaD（实证研究） - 主题文献综述 - 理论分析 - 案例研究 - 政策简报 - 会议论文 — ## 技能详情各智能体职责及各阶段产物现位于 `docs/ARCHITECTURE.md`。版本号在此锚定，以便发布元数据集中管理。 ### 深度研究 (v2.8) 13 智能体研究团队。模式：完整、快速、评审、文献综述、事实核查、苏格拉底、系统综述。完整智能体名单及产物：参见 ARCHITECTURE.md §3。 ### 学术论文 (v3.0) 12 智能体论文写作流程。模式：完整、规划、仅大纲、修订、修订教练、仅摘要、文献综述、格式转换、引文检查、披露。输出：MD + DOCX（通过 Pandoc，若可用）+ LaTeX（APA 7.0 `apa7` 类 / IEEE / Chicago）→ 通过 tectonic 生成 PDF。完整智能体名单及各阶段职责：参见 ARCHITECTURE.md §3。 ### 学术论文审稿人 (v1.8) 7 智能体多视角评审，采用 0-100 质量标准。模式：完整、重新评审、快速、方法论聚焦、引导、校准。决策映射： ≥80 接受，65-79 小修，50-64 大修，<50 拒稿。首轮评审团队与狭义重新评审团队边界：参见 ARCHITECTURE.md §3 阶段 3 / 阶段 3’。 ### 学术流程 (v3.7) 10 阶段编排器，具备完整性验证、两阶段评审、苏格拉底辅导及协作评估。流程保证：每个阶段均需用户确认检查点；完整性验证（阶段 2.5 + 4.5）不可跳过；R&R 可追溯性矩阵（模式 11）独立验证作者的修订主张。v3.4 在阶段 2.5 / 4.5 增加了合规代理（PRISMA-trAIce + RAISE）。v3.5 在每个 FULL/SLIM 检查点及流程完成时增加了协作深度观察器（`collaboration_depth_agent`，仅供参考 —— 从不阻断）。强制性完整性网关（2.5 / 4.5）明确跳过观察器，以免稀释合规检查。基于 Wang & Zhang (2026), IJETHE 23:11。各阶段矩阵（含智能体、产物及网关）：参见 ARCHITECTURE.md §3。 — ## v3.0 优化：我们发现了 AI 的哪些结构性局限 ### 发生了什么在使用 ARS 撰写一篇关于高等教育中 AI 的反思文章时，我遇到了三个无论多少提示词工程都无法解决的结构性问题： 1. 框架锁定（Frame-lock）：我要求 AI 就其自身论点进行魔鬼代言人辩论。它照做了 —— 四轮，每一轮都比前一轮更精炼。但每一轮都停留在我设定的框架内。魔鬼代言人攻击论点，从未攻击前提。它从未问“我们是否在讨论正确的问题？”这与导致 v2.7 压力测试中 31% 引文错误率的模式相同：验证 AI 和生成 AI 共享相同的认知框架。 2. 反驳下的阿谀奉承（Sycophancy under pushback）：每次我挑战魔鬼代言人的攻击时，它都让步太快。它撤回发现的 speed 比发起攻击还快。模型的训练奖励对话和谐 —— 因此“用户反驳”被视为攻击错误的证据，而往往这只是意味着用户很坚持。 3. 意图误检测：当我仍在探索时，苏格拉底导师不断试图收敛并产出成果（“要我写下来吗？”）。它无法区分“用户想要深入的哲学讨论”与“用户想要 RQ 简报”。两者看起来都像参与，但需要相反的 AI 行为。 ### 我们改了什么（v3.0）魔鬼代言人 —— 让步阈值协议（`deep-research` + `academic-paper-reviewer`） - 魔鬼代言人现在必须在回应前对每次反驳进行 1-5 分评分 - 仅在评分 ≥4 时允许让步（反驳直接针对核心攻击并提供证据） - 评分 ≤3：坚持立场并重申原始攻击 - 抗

相似文章

@DataChaz: 有人刚刚为 Claude Code 发布了一套完整的10阶段学术研究流程。它不会替你写论文，但会…

X AI KOLs Timeline

Claude Code 的一个全新开源插件提供了一套10阶段的学术研究流程，能够处理参考文献搜集、引用验证和模拟同行评审，同时保持用户的写作风格。

@DivyanshT91162: Claude Code 刚刚获得了学术研究超级能力。有人构建了一个 10 阶段的 AI 研究系统，它不仅“撰写论文”……

X AI KOLs Timeline

一款专为 Claude Code 设计的全新开源 10 阶段 AI 研究系统插件，自动化了文献综述、引用验证和同行评审模拟。它通过事实核查和模拟批判性反馈，声称能够以极低的成本生成高质量的学术初稿。

@GoSailGlobal: Claude Code 102 针对学术研究者 Mushtaq Bilal 博士的 Claude Code 102 出来了第一篇 4M+ 阅读 / 这一篇接得很硬他的核心论点：Claude Code 完全可以当成「长期研究项目」的工作…

X AI KOLs Timeline

The article details Dr. Mushtaq Bilal's guide on using Claude Code as a workflow engine for long-term academic research, outlining five key modules including file organization, subagents, and automation hooks.

@MushtaqBilalPhD: https://x.com/MushtaqBilalPhD/status/2057786613795639582

X AI KOLs Timeline

一份全面的入门指南，面向非技术背景的学术研究人员，介绍如何使用Claude Code，涵盖安装、项目组织以及无需编程技能即可自动化研究任务。

我构建了一个开源Claude Code插件，强制实施规范驱动的工作流（访谈→规范→计划→任务→代码）

Reddit r/ArtificialInteligence

介绍Specsmith，一个用于Claude Code的开源插件，强制实施规范驱动的工作流（访谈、规范、计划、任务、代码），以减少歧义并提高代码质量，目前处于早期v0.1版本。

相似文章

@DataChaz: 有人刚刚为 Claude Code 发布了一套完整的10阶段学术研究流程。它不会替你写论文，但会…

@DivyanshT91162: Claude Code 刚刚获得了学术研究超级能力。有人构建了一个 10 阶段的 AI 研究系统，它不仅“撰写论文”……

@GoSailGlobal: Claude Code 102 针对学术研究者 Mushtaq Bilal 博士的 Claude Code 102 出来了 第一篇 4M+ 阅读 / 这一篇接得很硬 他的核心论点：Claude Code 完全可以当成「长期研究项目」的工作…

@MushtaqBilalPhD: https://x.com/MushtaqBilalPhD/status/2057786613795639582

我构建了一个开源Claude Code插件，强制实施规范驱动的工作流（访谈→规范→计划→任务→代码）

提交意见反馈

@GoSailGlobal: Claude Code 102 针对学术研究者 Mushtaq Bilal 博士的 Claude Code 102 出来了第一篇 4M+ 阅读 / 这一篇接得很硬他的核心论点：Claude Code 完全可以当成「长期研究项目」的工作…