主代理在进入某阶段时才读对应章节(渐进式加载,省上下文)。每一阶段都按 SKILL.md 的 「阶段执行协议」跑:横幅 → in_progress → plan → execute → review → revise → 快照 → done → 阶段闸门。本手册给出每阶段「调哪个 skill / 派哪种 subagent / 产出什么 / 失败怎么回退」。
所有路径里的
67/=skills/67-econfin-workflow-toolkit/。调用某 skill 一律按skill-map.md§0 的调用协议:优先Skill(<注册名>),报 not found 就退回Read <folder>/SKILL.md内联执行,绝不凭记忆脑补。可直接复制的 subagent 派发模板见subagent-templates.md。进入 Stage 3 前还必须加载research-grade-methods.md,用它定义现代因果推断/应用计量的最低证据包。 Stage 2 结束、Stage 3 开始前还要加载empirical-audit.md,确保样本构造、 变量口径、missingness/balance/overlap 与目标 estimand 对齐。 Stage 3–4 的 Python/StatsPAI、Stata、R 三种分析后端按analysis-backends.md选择;默认后端为python-statspai。 每个因果设计还必须加载design-gate-cards.md,把设计分支的 required artifacts、 hard fail 与 claim 降级规则写进method_gate.md和evidence_ledger.md。 想先看一条完整跑通的 trace(每阶段产物 + 两道闸门如何触发 + NOT PASS→回退→PASS 循环),见worked-example.md——它就是下面这套协议的填空范本。 工具、网络、MCP 或统计软件不可用时按runtime-fallbacks.md退化执行; 涉及受限数据、PII、IRB/DUA 或 archive boundary 时按data-governance.md先登记再推进。 识别威胁、选择性报告、external validity、SUTVA/溢出和 attrition 风险按design-risk-ledger.md写入03_analysis/design_risk_ledger.md,作为 Method Gate 的上游硬约束。
目的:把一个研究方向收敛成一份可直接进入实证的 proposal(X→M→Y、识别策略、样本、贡献边际、 目标期刊)。
plan
- 若用户已给方向,直接用;否则
AskUserQuestion问方向 + 想要的候选标题数 N(缺省 5)。 - 读
67/econfin-idea-finder/SKILL.md,按其漏斗逻辑运行。 - 加载
literature-and-positioning.md:用滚雪球 + 引用图工具把相关文献 找全,建01_proposal/lit_matrix.md让贡献白space可见;贡献句按writing-craft.md§3 三槽 + 该文件 §4 定位句式锻造,命中 Edmans 红线就回炉。
execute(并行 subagent,强制调用子 skill) — 直接套用
subagent-templates.md §S1:
- 用
Agent派 N 路并行 subagent(每批 ≤5),每个 subagent 的 prompt 必须强制它:Skill(skill="Econfin-Proposal")(注册名大写,见 skill-map §0.1)生成计划书;not found 则Read 67/econfin-proposal/SKILL.md执行;Skill(skill="novelty-check")查新打分;not found 则Read 67/novelty-check/SKILL.md;- 只有 novelty ≥ 9(顶刊层次)才把「proposal + 查新」合并 md 写入工作区
01_proposal/candidates/<短名>-<分数>.md——这是对econfin-idea-finder硬编码F:\Dropbox\CC\选题大全\输出根的强制覆盖(见 skill-map §0.2);否则内部丢弃、不写盘、不回传全文; - 只向主代理回传 ≤8 行摘要(标题、分数、是否保留、一句话贡献)。
- 主代理再
Skill(skill="Significance-Search")(注册名大写)给保留候选补「学术 + 现实」重要性证据;Skill(skill="journal-digest")扫目标期刊近年口味——调用时显式要求它把摘要写到01_proposal/journal_digest.md(同样覆盖其 Dropbox 硬编码输出)。
review(独立 critic subagent)
- 派一个「资深 AE」critic subagent,拿 Edmans (2024) "1000 Rejections" 红线对每个保留候选挑刺
(是不是 convex combination、贡献是否单薄、识别是否可信),把意见写入
01_proposal/critique.md。
revise / 交付
- 主代理据 critique 让用户(或在全自动档位下自行)选定 1 个标题,把最终计划书定稿为
01_proposal/proposal.md,并在其中显式写死:被解释变量 Y、核心解释变量 X、机制 M、 识别策略(DiD/IV/RDD/SC/...)、样本与政策冲击、目标期刊。这份proposal.md是后续所有阶段的合同。 - 若已经能判断识别路线,顺手写一版
03_analysis/design_register.md草稿;Stage 3 开始时再按research-grade-methods.md补齐 estimand、诊断证据与回退方案。 - 同时从
templates/design_risk_ledger.md起草03_analysis/design_risk_ledger.md:至少列出 proposal 可能命中的 OVB、选择、bad controls、spillover/SUTVA、 external validity、attrition 和 specification-search 风险。此时可为pending,但不能空白。
失败回退:N 个候选全 < 9 分 → 扩大方向或换角度重跑一轮;查新发现已被做过 → 标红,回到 plan 另寻差异化切口。
目的:依 proposal 的变量与样本,拿到分析就绪的数据集 + codebook。
plan:从 proposal.md 抽出需要的变量、频率、地域、时间窗、合并键,列一张「变量→数据源」需求表。
加载 data-governance.md 与 empirical-audit.md,先从
templates/data_governance.md 生成 00_meta/data_governance.md,从 templates/sample_audit.md 生成
02_data/sample_audit.md。前者记录 public / restricted / confidential / PII、DUA、IRB/ethics、许可证、
再分发边界;后者预留 raw→clean→estimation sample 的 N、单位数、treated/control 数、drop 原因和脚本行号。
execute
Skill调用67/data-fetcher取数(FRED / World Bank / BLS / OECD / Yahoo Finance;A 股/中国 宏观等可配合57-dgunning-edgartools、58-charlescoverdale-econstack、59-shiquda-openalex-skill等集合,见 skill-map)。多个独立数据源可并行 subagent 各取一段、各自写盘到02_data/raw/。Skill调用67/data-cleaning做清洗、对齐、合并、构造变量,产出02_data/clean.parquet(或.dta/.csv)与02_data/codebook.md(每个变量的定义、来源、单位、缺失处理)。- 同步填写
02_data/sample_audit.md:合并键唯一性、样本限制、缺失/attrition、baseline balance、 overlap/common support、treatment timing、cluster level/cluster count 与权重口径必须落到表格或图。 - 受限数据只保留 fetch/clean 脚本、变量字典和访问说明;不得把原始数据、PII、token、签名 URL 或 DUA/IRB 限制材料放进公开包、日志或仓库。
review:critic subagent 核对——合并键唯一性、面板是否平衡、极端值/缺失处理是否记录在 codebook、
处理与对照如何界定(若是 DiD/SC)、sample_audit.md 的样本流失/estimand 对齐/missingness-balance/overlap
是否足以支撑下一阶段、数据治理登记是否与 codebook/DAS 原料一致。意见写 02_data/data_audit.md,
并更新 workflow_state.json.empirical_audit。
revise / 交付:据审计修清洗脚本,重跑到干净。清洗脚本必须留在 02_data/,保证可复现。
sample_audit.md 若为 NOT PASS,Stage 3 只能做探索或修数据,不能把 Method Gate 标 PASS。
失败回退:关键数据取不到 → 标红,给替代代理变量方案或缩小样本,必要时回 Stage 1 调整设计。
目的:按 proposal 的识别策略,先注册设计,再跑出基准 + 机制 + 异质性 + 稳健性的真实结果, 最后用方法闸门确认最低证据包齐全。
plan(先定设计,再定方法)
-
必读
research-grade-methods.md+design-gate-cards.md+empirical-audit.md+inference-and-uncertainty.md(推断口径)+mechanism-and-channels.md(机制主张分类)+design-risk-ledger.md(设计风险总账)+analysis-backends.md。先用 empirical audit 确认 estimation sample、变量构造、 missingness/balance/overlap 与 estimand 对齐,再用 methods pack 定识别合同,最后用 backend 文件选择python-statspai/stata/r;若选python-statspai或需要 StatsPAI 交叉验证,再读statspai-analysis.md。StatsPAI 引擎(MCP 优先拍板/拟合/诊断,statspai包做出版级出表)的 §1 8 段映射、§3 估计量路由、§6 七块稳健性闸门是本阶段的操作主线。 把 proposal 的识别路线翻译成03_analysis/design_register.md: estimand、treatment、comparison group、识别假设、主估计量、必需诊断、替代估计量、失败回退。 同时确定本研究使用哪张 design gate card,并在design_register.md写清最强目标 claim、样本/时窗/处理版本 边界,以及触发降级的条件。 立刻刷新03_analysis/design_risk_ledger.md:把 threats-to-validity 命中的威胁、design-transparency 的 PAP/MDE/设定曲线/研究者自由度要求、external validity/transport 边界、spillover/SUTVA 和 attrition 风险逐项 标为pending/pass/not_pass/not_applicable,并写明每项的 claim consequence。 -
分析后端分流(analysis-backends):默认
workflow_state.json.analysis_backend.primary=python-statspai。 用户或既有脚本指定 Stata 时加载Full-empirical-analysis-skill-Stata(not found 则Read skills/00.2-Full-empirical-analysis-skill_Stata/SKILL.md)并产出.do+.log;指定 R 时加载Full-empirical-analysis-skill-R(not found 则Read skills/00.3-Full-empirical-analysis-skill_R/SKILL.md)并产出.R/.qmd。三种后端都必须生成 后端无关的03_analysis/results/main_results.json、summary.md、method_gate.md和复现脚本。 -
领域模式分流(statspai-analysis §2):默认应用计量;用户措辞含 target trial / IPTW / TMLE / 孟德尔 随机化 → Mode A(流行病学,报风险差/比/HR/RMST + E-value);含 causal forest / DML / CATE / policy → Mode B(ML 因果,CATE 分布 + policy value + conformal)。
-
同时加载
threats-to-validity.md(把稳健性矩阵设计成「针对每个识别威胁的 回应」,并按 §3 给控制集标注前处理/混淆/中介/对撞、剔除坏控制)与design-transparency.md(估计前写预分析计划锁定设计;空结果报 MDE;DiD 跑 预趋势功效 + HonestDiD、设定曲线,登记随机种子)。 这些透明度和识别威胁不是散文备注:适用项必须同步进入design_risk_ledger.md的 Threat Register。 -
若估计工具、StatsPAI MCP、Stata/R/Python 包或网络不可用,按
runtime-fallbacks.md选择等价 route;若无法生成最低证据包,method_gate.md必须NOT PASS,不得把 fallback 当作完整验证。 -
从
proposal.md读识别策略,按下表择一主 skill(决策树细节见 skill-map 的「方法路由」):设计 主 skill( 67/)配套 政策评估 / 自然实验 / 双重差分 did-analysis平行趋势、事件研究、交错估计量 CS/SA/BJS、TWFE 风险对照 内生性 / 工具变量 iv-estimation弱工具检验、过度识别 断点 rdd-analysis带宽、robust bias-corrected CI、操纵/密度检验、协变量连续性 单一处理单位 / 政策试点 synthetic-controldonor weights、pre-fit RMSPE、安慰剂、SDID 备选 一般面板 panel-dataFE/RE、聚类稳健 SE、wild cluster/bootstrap(小 cluster) 截面 / 基础回归 ols-regression稳健 SE 时间序列 / 宏观 time-series单位根、协整、VAR/IRF 异质处理效应 / 高维 ml-causalDML、EconML/DoubleML、因果森林/GRF、overlap 与 cross-fitting -
默认主引擎 = StatsPAI(MCP 优先):当后端为
python-statspai时走 MCP 链路做 agent-native 拍板 / 拟合 / 诊断 / 稳健性自检, 全程不落 Python:detect_design → preflight → recommend → 用 as_handle=true 拟合得 result_id → audit_result(result_id) 列出缺的稳健性 → 逐个调它 emit 的 suggest_function → honest_did_from_result / sensitivity_from_result → bibtex(keys) 取可信引用(paper.bib为唯一真源)。 设计→函数路由见statspai-analysis.md§3。 -
需要出版级三格式表图 / 8 段 paper bundle 时切到
statspai包(sp.feols/sp.regtable/sp.collect, 见 statspai-analysis §4–5):MCP 拍板拟合后用包出表,两条路径的系数 / SE / N / 聚类必须对得上, 对不上先停下查口径。若改用 Stata/R/Python 方法包(Statareghdfe/ivreg2/csdid/rdrobust,Rfixest/did/grf/DoubleML,或 Python DoubleML、EconML、DoWhy、GRF、PyFixest、rdrobust、 CausalPy),按对应 child skill 和 methods pack §1 的官方入口核对 API;无论走哪条,都把包版本、seed、关键参数(或 MCP 的result_id与设计判定)写入估计脚本或method_gate.md。
execute
- 按后端跑基准回归:
python-statspai:按 statspai-analysis §3,用 MCPfit(as_handle)拿result_id,或本机statspai包跑sp.feols/sp.callaway_santanna/sp.ivreg/sp.rdrobust等。stata:按Full-empirical-analysis-skill-Stata跑03_analysis/estimate.do/master.do,用reghdfe、ivreg2、csdid、eventstudyinteract、sdid、rdrobust、synth等;保存.log和 标准化main_results.json。r:按Full-empirical-analysis-skill-R跑03_analysis/estimate.R/master.qmd,用fixest::feols、did::att_gt、rdrobust、synthdid、grf、DoubleML等;保存sessionInfo()/renv.lock信息和标准化main_results.json。 可按需Skill调用选定的67/估计 skill、Stata MCP、PyFixest 或 R route 做交叉验证——但同一主结果 只认一份口径一致的系数。
- 稳健性矩阵并行化(套用
subagent-templates.md§S3):按 statspai-analysis §6 的七块稳健性闸门(安慰剂 / 替换样本 / 设定曲线 / 替换 SE / Oster 界 / HonestDiD / E-value)+ 机制中介 把彼此独立的检验一次性派多个 subagent 并行跑,每个 subagent 自己把系数/SE/图写盘到03_analysis/robustness/<name>.json|png,只回传"通过/不通过 + 关键系数"。这七块正是下面method_gate.mdartifact 表的实现入口,缺一块对应行标no。 - 所有代码留在
03_analysis/(.py/.do/.R/.qmd),结果存03_analysis/results/,并把后端选择、 脚本扩展名、版本检查写入00_meta/analysis_backend.md与workflow_state.json.analysis_backend。 - 同步写
03_analysis/method_gate.md的 artifact 表:主结果、识别诊断、稳健性矩阵、复现脚本都必须 有路径;02_data/sample_audit.md也必须作为必需 artifact 进入表格,且其 final estimation sample 的 N、 treated/control 数、cluster level 必须与main_results.json对上。缺失项标no,不得用空话替代。 同步写03_analysis/inference_report.md(聚类层级与 cluster 数、few-cluster 修正、随机化推断、多重检验族与 校正、弱工具区间,见inference-and-uncertainty.md);有机制主张则按mechanism-and-channels.md把它分类、把中介移出主设定、结果落03_analysis/mechanism/。 同步更新03_analysis/design_risk_ledger.md:每个适用 threat 必须指向真实诊断或 refuter artifact;仍未关闭的 blocking threat 写入Blocking Threats,并同步到workflow_state.json.design_risk.blocking_threats。 还要按design-gate-cards.md填写 Design Gate Card:列出当前设计卡每个 required artifact 的路径、 是否通过、以及对应 claim consequence(causal / qualified_causal / descriptive / exploratory / no_claim)。 方法闸门给出的最强 claim 等级必须同步写入workflow_state.json.evidence_governance.claim_strength。 方法闸门还要检查00_meta/data_governance.md:合法访问、公开包边界、PII/小样本披露、IRB/DUA 状态若阻断主结果,列入 hard flags。 - 同步刷新
00_meta/evidence_ledger.md:为每个主结果写 claim row、estimand-to-claim map、result ID、 robustness/threat matrix;若任何 claim 强于 design gate card 允许等级,把该行标成no_claim或降级,并在 Open Discrepancies 中记录。 如果design_risk_ledger.md对某个 claim 的 consequence 更低,以更低者为准。
review:派一个 66-zheng-siyao-empirical-research-skills 风格的 critic(did-reviewer /
econ-reviewer)做对抗审阅——识别假设是否真的成立、SE 聚类是否正确、是否 p-hacking 嫌疑、methods
pack 对应的最低证据包是否齐全。意见写 03_analysis/results_audit.md,方法闸门判定写
03_analysis/method_gate.md;设计风险判定写 03_analysis/design_risk_ledger.md 并刷新
workflow_state.json.design_risk。若样本审计暴露 estimand 漂移、bad-control、overlap 或聚类层级问题,
先回 Stage 2/3 修数据或设定,不得用更多稳健性表掩盖。
revise / 交付:据审阅补检验、修设定,定稿 03_analysis/results/main_results.json 与一份
03_analysis/results/summary.md(人话版结论)。置 done 前跑一次
python3 scripts/check_workspace_gates.py <workspace> 机械核对(method_gate 标 PASS 时所需 artifact 必须真的在盘上)。
只有 method_gate.md 为 PASS、workflow_state.json.design_risk.status=pass、且机械核对无 hard 不一致时,Stage 3 才能置
done 并进入 Stage 4;否则按 method_gate.md 的 Next Action 回退。
失败回退(关键):平行趋势不过 / IV 弱工具 / 系数不显著 / 机制不成立 → 不要硬写成功。
按 China-CF-study 纪律自动切备选:换识别策略、换工具变量、换对照组、改窗口;连续失败则在闸门
标红,回 Stage 1/2 调设计或数据。每次回退都记进 logs/stage_3.md。
目的:把 Stage 3 的结果按所选分析后端做成出版级三格式表(LaTeX/Word/Excel 同出)与图 (事件研究图、系数图、机制图)。
execute
- 先读
workflow_state.json.analysis_backend.primary,再按analysis-backends.md§4 选出表路径。所有后端都必须落04_results/*.{tex,docx,xlsx}和04_results/*.{pdf,png},并生成04_results/exhibits_index.md。 每张表图还必须回填00_meta/evidence_ledger.md的 Exhibit and Script Map,保证每个 exhibit 都能追溯到 claim、result、生成脚本和重建状态。 python-statspai主路径 = StatsPAI 出表栈(statspai-analysis §4,用statspai包):把 Stage 3 的结果对象喂给sp.regtable(M1..M5, template="aer")(Tier 1 单表)/sp.paper_tables(main=, heterogeneity=, robustness=)(Tier 2 多面板)/sp.collect("Title")(Tier 3 整场 bundle),用.to_word()/.to_excel()/.to_latex()同时落04_results/*.{tex,docx,xlsx}(合作者改 Word、编辑要 Excel、CI 编 LaTeX)。永远不要从 pandas 手搓 Word/Excel。需纯 LaTeX 三线表时Skill调用67/table(或66/latex-table)作替代/补充;Stata 用户可配18-jusi-aalto-stata-accounting-research、32-dylantmoore-stata-skill的表格规范。stata路径:用esttab/estout输出.tex/.rtf,用outreg2或 Stata 17+collect输出.xlsx/.docx,图用graph export同时输出.pdf+.png。表注必须包含 FE、cluster、N、星标和样本说明。r路径:用modelsummary/fixest::etable/ Quarto 输出.tex/.docx/.xlsx,图用ggsave(..., dpi=300)同时输出.pdf+.png。如果用 Quarto,渲染脚本也留在03_analysis/或收尾 master script 中。- 图:StatsPAI 标准图谱(statspai-analysis §5):
sp.enhanced_event_study_plot(cs)(事件研究,从 CS/SA 结果出)、sp.coefplot(...)(系数森林)、sp.rdplot、sp.cate_plot、sp.spec_curve(...).plot()、sp.sensitivity_plot(sp.honest_did(...))。每个 plotter 返回(fig, ax)(binscatter是 3 元组),解包后fig.savefig(..., dpi=300)落04_results/*.pdf+*.png;脚本顶部先跑一次 CJK+retina 设置。需要时Skill调用67/figure或39-vincentarelbundock-marginaleffects(边际效应图)作补充。
review:critic 检查——表注是否齐(样本量、R²、聚类层级、显著性星标说明)、图是否自解释、
数字与 Stage 3 结果一致。意见写 04_results/figtab_audit.md。
revise / 交付:定稿 04_results/,并生成一份 04_results/exhibits_index.md 列出每张表/图对应
论文的哪个论点,供 Stage 5 写作直接引用。
目的:从表图产出一份结构完整的 LaTeX 初稿。
execute
Skill调用67/paper-writer,喂入04_results/(表图)+01_proposal/proposal.md(动机/贡献/ 假设),让它按"Intro → 文献/制度背景 → 数据 → 识别策略 → 结果 → 机制 → 稳健性 → 结论"写出05_draft/main.tex与05_draft/ref.bib。 写作 prompt 必须附00_meta/evidence_ledger.md,要求每个摘要、引言、结果和结论 claim 使用不高于 ledger 允许等级的措辞;ledger 中descriptive/exploratory/no_claim的内容不得被包装成主因果发现。 还必须附03_analysis/design_risk_ledger.md:识别段、稳健性段、政策含义和 cover letter 的外推边界不得 强于 design risk ledger 的 claim consequence。- 文献综述薄弱时,配合
36-taoyunudt-literature-review-skill、52-keemanxp-slr-prisma、59-shiquda-openalex-skill补做结构化综述;引用入库可配 Zotero MCP。 - 写作标尺:按
writing-craft.md(引言五段公式、解剖结构、量级纪律)写;识别段按threats-to-validity.md§5 加一段「Threats to Identification」先发制人、把每个 威胁指到robustness/真实 artifact;related-work 段按literature-and-positioning.md§4 点名最接近的 3–5 篇、说清本文前进在哪。
review:critic 通读——贡献句是否锋利、识别策略段是否说服力够、结果段是否克制(不过度解读)。
意见写 05_draft/draft_audit.md。
revise / 交付:据审阅改一轮,定稿初稿。注意:此处只求"完整且自洽的初稿",精修留给 Stage 6。
目的:把初稿过一遍成熟的固定打磨流水线。
execute
- 直接
Skill调用67/paper-pipeline,把05_draft/(或复制到06_polish/)和目标期刊 传给它。它内部会按固定顺序自动跑:paper-polish → paper-self-revise → paper-style → paper-polish(二轮)→ reference-verify,并自带它自己的pipeline_state.json、阶段备份、 交互档位。不要在这里重复它的逻辑——本编排器只负责把输入喂对、把它的产出收回主线。 - 把
paper-pipeline的交互档位与本编排器的档位对齐(全自动↔全自动 / 阶段确认↔stage-confirm)。
交付:打磨后的 06_polish/main.tex + ref.bib + ref_verify_report.xlsx + pipeline 报告。
失败回退:paper-pipeline 内部中断 → 它自身可断点续跑,本编排器记录其状态后在闸门提示用户。
目的:消除 AI 腔 / 翻译腔,达到人类学者写作质感(按 Stage 0 选定的语言分流)。
execute
- 英文稿:
Skill调用67/readability做语法/可读性逐项修;再按需用44-matsuikentaro1-humanizer_academic、45-stephenturner-skill-deslop、46-hardikpandya-stop-slop、47-conorbronsdon-avoid-ai-writing去 AI 套话;经济学行文规范配56-hanlulong-econ-writing-skill。 - 中文稿:
Skill调用67/fix-chinese(去翻译腔 + 中英混排规范)+67/chinese-quote-converter(直引号转弯引号);再按需用48-copaper-ai-chinese-de-aigc、49-voidborne-d-humanize-chinese做中文去 AIGC。 - 去味是"逐句改写"性质,独立段落可并行 subagent 处理,各自写盘回
07_dehumanize/。
review:critic 抽查——是否仍有"首先/其次/综上所述/值得注意的是"等套话、是否破坏了术语准确性。
revise / 交付:定稿到 07_dehumanize/main.tex,回灌主稿。
目的:兑现「高质量初稿」承诺。不靠主代理自评,而是派一个独立「顶刊 AE」critic subagent,
按 quality-rubric.md 的 7 维评分卡量化打分,决定「放行进投稿」还是「回炉重做」。
execute(套用 subagent-templates.md §QG,只派 1 个)
- critic 必读
references/quality-rubric.md,读初稿(07_dehumanize/main.tex+04_results/表图 +05_draft/ref.bib)+ 对照01_proposal/proposal.md(贡献承诺)与03_analysis/results/summary.md(真实结果)+03_analysis/design_register.md/03_analysis/method_gate.md(方法证据)+00_meta/evidence_ledger.md(claim strength 和表图/脚本追溯),逐维打分写入00_meta/quality_scorecard.md,本轮分数追加进logs/quality_gate.md。 若存在03_analysis/design_risk_ledger.md,critic 也必须读取;有 blocking threat 时识别/稳健/解读相关维度按 rubric 封顶,不能因为稿件写得顺就放行。 - 7 维:① 贡献锋利度 ② 识别可信度 ③ 稳健性完整度 ④ 解读克制度 ⑤ 写作与结构 ⑥ 引用真实性 ⑦ 可复现性。
达标判定(三条同时满足才 pass):每维 ≥ 7 且 总分 ≥ 56/70 且 ②③⑥ 无任何致命红旗。
revise / 回退
pass→workflow_state.json置quality_gate=pass、draft_milestone=done;进入可选 Stage 8–9。not pass→ 按评分卡的「短板 → 回退阶段」映射退回对应阶段重做(识别→Stage 3、贡献→Stage 1、 写作→Stage 5/6、引用→reference-verify、复现→Stage 2/3)。同一维最多回退 2 轮;2 轮后仍卡, 在闸门显著标红告知用户「已知短板 + 当前分」,由用户裁决是否带病进入投稿(绝不静默放行)。- 每次回退记入
logs/quality_gate.md与workflow_state.json的decisions。
质量门 ≠ Stage 6 打磨(改语言)≠ Stage 8 评审(挑学术硬伤);它只做一件事——按统一 rubric 量化「这份初稿够不够格」并决定放行/回炉。它是「可投稿级初稿」这一核心交付里程碑的验收闸门。
目的:在投稿前先自做一轮"审稿—回应—修订",把硬伤暴露在自己手里。
execute
- 加载
peer-review-and-submission.md(五维审稿 + Essential/Desirable 分级、逐条可追溯的 response letter 模板)与threats-to-validity.md(审稿命中 识别威胁时,按其 §2 末列「被问到怎么回应」逐条回应、指向具体修改位置)。 同时加载design-risk-ledger.md,把03_analysis/design_risk_ledger.md中未完全关闭 或只允许降级措辞的风险转成模拟 reviewer objections 和主动回应。 Skill调用67/referee-report生成审稿报告(可设 normal/high-level 档与意见条数; 推荐先按 Major Revision 口吻拿到建设性意见),落08_review/referee_report.md。Skill调用67/paper-referee-revise,按审稿意见逐条修订main.tex,并生成 response letter 落08_review/response_letter.md。若是内部自评则用67/paper-self-revise。- 想要更狠的对抗审阅可叠加
66/grillme、66/econ-reviewer、21-claesbackman-AI-research-feedback、41-sticerd-eee-sewage-econometrics-check(计量自检)。计量复核可再用 StatsPAI MCPaudit_result(result_id)复跑「还缺哪些稳健性」,与03_analysis/method_gate.md对账(statspai-analysis §6)。 审稿人还必须抽查00_meta/evidence_ledger.md:摘要、贡献段、结果段、cover letter 的每个 claim 是否都有 result/exhibit/script 支撑,且措辞没有超过 design gate card 允许等级。 - 引用存在性 + 时序完整性专项:派
subagent-templates.md§CT critic(pre-review 模式)—— 按citation-and-temporal-integrity.md核引用真实存在/非撤稿/引对 + 审 look-ahead/vintage 时序,写00_meta/citation_integrity_log.md并跑check_citation_integrity.py; 与并行的 claim-忠实度审计(integrity-and-claim-audit.md)分工互补。
review:critic 核对——每条审稿意见是否都有实质回应、修订是否引入新矛盾(交叉引用、表号)。
revise / 交付:定稿修订稿 + response letter 到 08_review/。
失败回退:审稿暴露根本性识别缺陷 → 回 Stage 3(补检验/换策略)甚至 Stage 1(改设计),并标红。
目的:定目标期刊、备齐投稿材料、做最后一次引用终审。
execute
Skill调用67/paper-submission,评估贡献新颖度、匹配 SSCI/ABS 星级、给出 ~20 本目标期刊清单, 落09_submission/journal_shortlist.md。结合 Stage 0 选定的目标期刊收敛到 1 主 + 2 备。- 终审引用:再
Skill调用一次67/reference-verify(投稿前最后一次,确保此前所有修订没动坏 引用),落09_submission/ref_verify_final.xlsx。 - 引用/时序终审闸门:跑
python3 scripts/check_citation_integrity.py <workspace> --final—— 不得残留to-verify、不得有未处置flagged、撤稿筛查通过、§2 时序无未排除的risk;不过则投稿包不得标 ready (见citation-and-temporal-integrity.md§4)。 - 生成 cover letter / highlights / 作者贡献声明等投稿材料到
09_submission/。 - 从
templates/submission_checklist.md生成09_submission/submission_checklist.md,并按目标刊官网实时刷新: author guidelines、data/code policy、匿名化、DAS、IRB/ethics、disclosure、AsCollected 或等价 provenance。 若政策页无法访问,按runtime-fallbacks.md标 blocked,投稿包不得标 ready。 - 需要排版成 Word / 提交版 PDF 时用
67/md-to-docx、67/markitdown、08-ndpvt-web-latex-document-skill。
review:critic 走一遍目标期刊的 submission checklist(字数、匿名化、利益冲突声明、数据可得性声明、 IRB/DUA 与公开复现包边界)。
revise / 交付:定稿投稿包到 09_submission/。
汇总所有阶段日志与产出,优先用 templates/FINAL_REPORT.md 写 FINAL_REPORT.md(见 SKILL.md「收尾」
节的清单),并按 reproducibility-pack.md 与
data-governance.md 生成 REPLICATION.md、DAS(如需)、data governance register
与 master script(模板见 templates/REPLICATION.md、templates/DAS.md、templates/run_all.sh)。
能真实重跑就删派生产物后跑一次;不能重跑就把阻断原因写进
workflow_state.json.replication_pack.last_rebuild_check,且 status 只能是 not_ready。
最终打包并告知用户交付物路径、一键重跑命令、复现包状态、投稿前仍需人工确认的事项。