@tom_doerr:利用23,000个AI代理技能自动化实证研究 https://github.com/brycewang-stanford/Auto-Empirical-Research-…

X AI KOLs Timeline 工具

摘要

Auto-Empirical-Research-Skills (AERS) 是一个开源工具包,利用23,000多个AI代理技能自动化整个实证研究流程,从数据清洗到可提交的草稿。

利用23,000个AI代理技能自动化实证研究 https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills…
查看原文
查看缓存全文

缓存时间: 2026/06/02 21:38

通过23,000项AI智能体技能自动化实证研究 https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills… — # brycewang-stanford/Auto-Empirical-Research-Skills 来源:https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills # 自动化实证研究技能(AERS,23K+ 技能) > [!NOTE] > 仓库已重命名 → 现为“Auto“。 本项目最初名为Awesome Agent Skills for Empirical Research,现更名为Auto-Empirical-Research-Skills(AERS)。新名称体现了核心理念:不仅是一个技能合集,更是一个自动端到端运行完整实证研究流程的智能体——从原始数据清洗→识别与估计→稳健性检验→表格、图表,到可投稿的草稿——只需极少量人工干预。 > > GitHub 会自动重定向旧 URL,但请更新您的书签和本地远程地址: > > bash > git remote set-url origin https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills.git > 🌐 语言:English | 中文 斯坦福 REAP × CoPaper.AI · 面向实证研究的学术-工业 AI 工具包 由斯坦福实证方法论团队打造——覆盖从数据清洗到顶级期刊投稿的完整流程 Awesome (https://awesome.re) GitHub 星标 (https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills) 许可协议:CC BY-SA 4.0 (https://creativecommons.org/licenses/by-sa/4.0/) 欢迎提交PR (CONTRIBUTING.md) 由斯坦福 REAP 的 CoPaper.AI (https://copaper.ai) 维护 由 StatsPAI (https://github.com/brycewang-stanford/StatsPAI) 驱动 安全已扫描 (SECURITY-SCAN-REPORT.md) 文件已审计 (SECURITY-SCAN-REPORT.md) 审计阶段 (SECURITY-SCAN-REPORT.md) 钩子已审计 (SECURITY-SCAN-REPORT.md) 零威胁 (SECURITY-SCAN-REPORT.md) 验证目录 (https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills/actions/workflows/validate-catalog.yml) OpenSSF 评分卡 (https://scorecard.dev/viewer/?uri=github.com/brycewang-stanford/Auto-Empirical-Research-Skills) 实证研究AI智能体技能的权威合集——119个GitHub仓库 / 23,000+项技能 > 一个经过筛选的、有观点的列表,包含119个GitHub仓库23,000+项AI智能体技能,面向经济学、政治学、社会学、心理学、公共卫生、教育学、管理学、金融学和公共政策领域的实证研究——按研究工作流程组织,从选题到期刊投稿。 到了2026年,做实证研究的方式正在被重新定义。 CoPaper.AI (https://copaper.ai) —— 由斯坦福REAP / SCCEI(斯坦福中国经济学与制度研究中心)(https://sccei.fsi.stanford.edu/reap) 的研究人员孵化的实证研究AI助手——可以在20分钟内完成一篇达到发表质量的实证论文:从数据导入、描述性统计、因果推断模型、稳健性检验,到格式化结果表格,一气呵成。 秘诀不在于更强大的模型,而在于技能(Skills):将资深研究者的方法论专长编码为结构化工作流,这样AI就能知道“完整的DID分析应该包含什么“,而不是等你一步步提醒。 这个仓库是我们在构建CoPaper.AI时整理的智能体技能全景图。我们将分散在GitHub、社区和学术界中的数百个技能仓库和数万项技能按研究工作流程阶段进行组织,以便你按需选取。 🎓 三层信任 · 为什么由我们构建 | 层级 | 锚点 | 杠杆 | |—|—|—| | 🏛️ 学术传承 | 斯坦福 REAP / SCCEI — 斯坦福中国经济学与制度研究中心 | 在实证经济学方法论和因果推断应用方面拥有持续发表记录的研究中心 | | 🔧 工程交付 | CoPaper.AI (https://copaper.ai) 实证研究AI助手 | 内置20项计量方法论技能(DID/IV/RDD/PSM/DML等)、Supervisor + 4个子智能体的多智能体架构、一句话触发、自动结果输出 | | ⚙️ 开源引擎 | StatsPAI (https://github.com/brycewang-stanford/StatsPAI)驱动CoPaper.AI的因果推断引擎 | 900+函数 · 一行 import statspai as sp · JOSS投稿中 · MIT许可。CoPaper.AI产生的每一个DID/IV/RD/SCM估计都由StatsPAI驱动;本技能合集本身就是StatsPAI生态系统的一部分 | > 🔒 放心使用:本仓库中全部52项技能 / 2,940+文件均通过了我们的系统性安全审计——52/52全部干净,零标记,零数据泄露,零反向shell,零提示注入。 > > 💡 想要开箱即用? 跳过技能组装——直接试试 → copaper.ai (https://copaper.ai),让斯坦福方法论团队为你端到端运行实证流程。 — ## 从这里开始 - 搜索本地索引:docs/search.html - 浏览生成的本地目录:docs/SKILL_CATALOG.md - 复制一个可立即运行的实证工作流:docs/GOLDEN_WORKFLOWS.md - 查看旗舰演示:docs/demos/ - 运行旗舰回归提示:docs/EVALS.md - 将技能安装或复制到智能体运行环境中:docs/INSTALL.md - 使用机器可读索引:catalog/skills.json - 协调并行智能体工作:docs/AGENT_COORDINATION.md - 检查来源与许可风险:docs/LICENSE_AUDIT.md - 检查贡献与验证规则:docs/QUALITY_GATE.md · docs/SKILL_SUBMISSION_GUIDE.md - 查看仓库审计与改进计划:docs/REPO_AUDIT_2026-05-31.md · docs/ROADMAP.md - 本地重建并验证:bash make catalog make validate ### 30秒选择一个工作流 | 目标 | 从何开始 | |—|—| | 运行完整实证流程 | StatsPAI_skill | | 审计Top 5经济学识别策略 | aer-identification | | 准备AER / AEJ投稿 | aer-workflow | | 构建复现包 | aer-replication | | 降低中文学术AI写作信号 | chinese-de-aigc | — ## 🆕 更新日志 2026-05-25:📕 AER-skills 已导入——Top 5经济学(AER / AER:Insights / AEJ)投稿栈(9项技能,skills/50)+ 每周自动同步工作流 - 📕 skills/50-brycewang-aer-skills: 本仓库的姊妹项目 brycewang-stanford/AER-skills (https://github.com/brycewang-stanford/AER-skills) 整体导入,采用相同的 StatsPAI 风格同步循环(scripts/sync-aer-skills.sh + .github/workflows/sync-aer-skills.yml — UTC时间每周一06:00差分,有偏差时自动创建PR)。定位:Top 5经济学投稿技能栈(AER / AER:Insights / AEJ系列),将 StatsPAI / 00.x 的“分析“线扩展到“手稿+投稿“线。 - 🧱 覆盖完整投稿流程的九项技能aer-topic-selection(AER vs Insights vs AEJ 路线选择)→ aer-identification(识别审计:现代DID / 弱工具变量 / 边界RDD陷阱)→ aer-robustness(预判审稿人的稳健性矩阵)→ aer-introduction(Keith Head五段式引言)→ aer-tables-figures(AER booktabs排版)→ aer-replication(AEA数据与代码可用性政策包,可提交openICPSR)→ aer-submission(预检:100字摘要、披露信、投稿信)→ aer-rebuttal(针对修改后手稿而非旧草稿撰写的R&R回复信)→ aer-workflow(协调器,告诉您下一步该用哪项技能)。 - 🆚 与现有技能的差异化:StatsPAI / 00.x 解决“如何正确运行分析“;AER-skills 解决“如何将论文写到Top 5接收门槛“——AER的100字摘要 / AER:Insights的7000字限制 / 45%的桌面拒稿率 / AEA强制复现是Top 5特有的约束,通用科技写作技能(Nature-Paper-Skills等)未覆盖。识别优先:如果你的设计脆弱,再好的行文也救不了。 - 🔁 供应商同步循环git clone --depth=1 上游 → rsync -a --delete --exclude='.git' 镜像整个树 → 对比内容哈希前后变化,无偏差则退出0,有偏差则退出1,触发 peter-evans/create-pull-request@v6chore/sync-aer-skills 分支上创建PR。支持手动 workflow_dispatch 按需同步。 - 许可:MIT — 与 StatsPAI / 00.x 一致;商业和学术使用均可。 - 首次上游提交7e9c44d (https://github.com/brycewang-stanford/AER-skills/commit/7e9c44d363c185edf27859096268b6a8256c4a2b) (2026-05-25,包含 modern-aer-exemplars.md,内含30+篇按子领域组织的论文)。 2026-04-28:🛡️ 仓库级安全扫描完成——全部52项技能均为干净,零标记 - 🛡️ SECURITY-SCAN-REPORT.md: 我们对该仓库中所有52项技能 / 2,940+文件进行了系统性安全审计。未发现恶意提示、病毒、木马、反向shell或任何其他恶意内容。 结论:本仓库中的每项技能均可安全使用。 - 🔍 六层纵深防御方法:(1) 针对13个风险类别(管道到shell、反向shell、凭证外泄、解码并运行、挖矿/RAT签名、提示注入等)进行自动grep → (2) 对所有6个包含钩子的技能及其40+个钩子脚本进行100%人工审查 → (3) 三个并行智能体分别审计SKILL.md正文、智能体定义和参考文档 → (4) 补充完整性检查(隐藏Unicode、编码异常、超长行、HTML注入、网络相关导入)。 - 📊 结果分布:每个“敏感“命中均被验证为三类合法类别之一——防御性安全规则(拒绝规则、bash安全钩子、凭证检测器)、合法的学术API调用(arXiv / CrossRef / PubMed / FRED / World Bank / OECD / BLS)、或标准Claude Code工作流钩子(脚手架/状态保存/上下文监视——均为本地文件操作,零网络IO)。 - 🔑 关键发现17-DAAF 实际上是本批次中最强的“安全感知“参考模板(14个防御钩子 + 32条拒绝规则 + 主动凭证扫描)。规模最大 ≠ 风险最高。 - 📈 可视化信息图:报告中嵌入5张知乎风格信息图(概览 / 方法 / 威胁矩阵 / Top5规模分布 / 补扫结果)——3秒内可读。 - 详见完整安全扫描报告。 2026-04-24:📗 完整实证分析技能(R版)发布——tidyverse + fixest,8步Quarto友好循环(skills/00.3) - 📗 完整实证分析技能 — R版: 同一天加入家族成为第四位成员,已导入至 skills/00.3-Full-empirical-analysis-skill_R/槽位#0.3,R / Quarto版本。 - 🧱 现代 tidyverse + fixest 栈:数据用 dplyr / tidyr / haven;面板/IV/DID主力用 fixest::feols/feglm/fepois(一行搞定高维固定效应+多向聚类+IV);现代DID用 did::att_gt + fixest::sunab + didimputation::did_imputation + synthdid + DIDmultiplegtDYN + bacondecomp + HonestDiD;RD用 rdrobust / rddensity / rdmulti / rdlocrand;合成控制用 Synth / gsynth / tidysynth / synthdid;匹配用 MatchIt / WeightIt / cobalt / ebal;ML因果用 grf::causal_forest + DoubleML;中介用 mediation::mediate + lavaan::sem;后估计用 marginaleffects::avg_slopes / plot_slopes;发表级表格用 modelsummary / kableExtra / gt / flextable;图表用 ggplot2 + iplot + binsreg + cowplot + patchwork;用 Quarto 一键渲染PDF/HTML/Word。 - 🔁 8步R闭环(与00.1/00.2一致):(1) 导入与清洗(read_dta + clean_names + naniar::vis_miss + mice + validate / assertr)→ (2) 变量构建(mutate + across + DescTools::Winsorize + scale + arrange %>% group_by %>% lag/lead)→ (3) 描述性统计(gtsummary::tbl_summary + modelsummary::datasummary_balance + psych::corr.test + corrplot / ggcorrplot)→ (4) 诊断(12类:shapiro.test / tseries::jarque.bera.test / lmtest::bptest / dwtest / bgtest / car::vif / tseries::adf.test / kpss.test / plm::pbgtest / pcdtest / phtest / lmtest::resettest)→ (5) 估计(12类:feols + AER::ivreg + did::att_gt + fixest::sunab + didimputation + synthdid + rdrobust + tidysynth + gsynth + MatchIt + WeightIt + ebal + grf::causal_forest + DoubleML + sampleSelection::heckit + quantreg::rq + lavaan::sem)→ (6) 稳健性(modelsummary 用于M1–M6 + clubSandwich + fwildclusterboot::boottest + ri2::conduct_ri + bacondecomp::bacon + HonestDiD::createSensitivityResults + robomit::o_test/o_beta)→ (7) 进一步分析(公式交互 + marginaleffects::plot_slopes + mediation::mediate + medsens + lavaan::sem 多组 + grf::causal_forest CATE + splines::ns 剂量反应)→ (8) 发表输出(modelsummary 一行调用即可生成LaTeX/Word/HTML/Markdown表格 + fixest::iplot + marginaleffects::plot_slopes/predictions + cowplot::plot_grid + patchwork + Quarto 渲染)。 - 📚 渐进式披露 + Quarto原生SKILL.md 893行核心(包含完整 install.packages 列表、项目骨架、Quarto YAML模板);8个 references/NN-*.md 合计3700+行。Quarto模板使得“叙述+代码+表格+图表“可从单个 .qmd 源渲染为一份自包含报告。 - 🆚 四项技能定位:StatsPAI = Python 单步DSL;00.1 = 显式Python;00.2 = 显式Stata;00.3 = R + tidyverse + Quarto。同一8步的四种并行实现,互不替代。Quarto渲染的可复现报告是00.3独有的。 - 使用场景:Quarto渲染的复现报告、学术博客(distill / quarto blog)、研究生R课程、需要 marginaleffects + mediation + grf 后估计的严谨项目、任何纯贝叶斯工作之外的R风项目。 2026-04-24:📊 完整实证分析技能(Stata版)发布——传统Stata生态,8步 .do 循环(skills/00.2) - 📊 完整实证分析技能 — Stata版: 与 StatsPAI / 00.1 同一天推出的Stata姊妹,已导入至 [`skills/00.2-Full-emp

相似文章

AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现

arXiv cs.AI

本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。

AutoResearch AI:迈向AI驱动的科学发现研究自动化

Hugging Face Daily Papers

一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。