这份指南写给第一次接触 Codex、GitHub 和 research-agent 工作流的人。
你不需要先看懂仓库里的每一个文件。这个 starter kit 的作用,是给 AI coding agent 一个本地项目工作区,让它按规则读文件、查证据、做检查,而不是只生成一段看起来流畅的文字。
这是一个本地优先的 research-agent starter kit。
它可以帮助 AI coding agent:
- 写作前先读项目规则;
- 下判断前先查 source;
- 小任务走轻量流程;
- 重要检查留下证据;
- 帮助在交付前标出薄弱的正式 Word/PDF 或 stakeholder-facing 输出;
- 避免把私人研究材料泄露到公开 GitHub。
它不是一篇已经完成的 dissertation、thesis、paper、report 或 app。你需要把它改成适合自己项目的版本。
最低要求:
- 一台电脑;
- Python 3.9 或更新版本;
- 一个可以读本地文件的 coding agent,例如 Codex、Claude Code、Cursor 或类似工具。
可选但有帮助:
- GitHub 账号;
- 本地安装 Git;
- Obsidian,如果你喜欢可视化笔记;
- Claude Code,如果你想要额外的独立 review。
如果你还不会 Git,也可以先把这个仓库当作一套本地文件和检查清单来用。
- 下载或 clone 这个仓库。
- 在 Codex 或其他 coding agent 中打开这个文件夹。
- 先读
README_CN.md。 - 如果是新项目,把
templates/AGENTS.example.md复制成AGENTS.md。 - 如果不知道该走哪条工作流,先看
docs/TASK_CARDS_CN.md。 - 第一个 substantial task 前,复制
templates/SOURCE_FIRST_INTAKE_CARD.md。 - 只填写已经确认的项;不确定的项保留
TO CONFIRM。 - 让 agent 先跑基础检查,不要一上来就写正式正文。
可以直接这样问:
请先读取 AGENTS.md、PROJECT_AGENT_PREFERENCES.md 和 RESEARCH_PROJECT_BRIEF_TEMPLATE.md。
帮我把这个 starter kit 适配到我的项目。
先不要写正式正文,先告诉我哪些项目事实和 source 文件还需要 TO CONFIRM。
可以先把 GitHub 理解成一个在线项目备份和分享平台。
几个基础词:
| 词 | 意思 |
|---|---|
| Repository / repo | 被 Git 管理的项目文件夹 |
| Commit | 一次保存下来的文件变更快照 |
| Push | 把本地 commit 上传到 GitHub |
| Pull | 把 GitHub 上的新变化下载到本地 |
| Branch | 一条单独的工作线 |
| Pull request | 用来 review 和合并分支的页面 |
如果你是新手,不要把私人研究数据 push 到公开 GitHub。raw data、transcripts、participant records、账号凭据、学校/机构内部材料,都应该留在公开仓库外。
公开分享前先运行:
bash scripts/privacy_check.sh然后人工检查 PRIVACY_CHECKLIST.md。
Codex 是一个 AI coding agent。你可以让它读文件、改规则、跑检查、整理项目记忆、生成研究工作流文档。
真正的执行边界来自本地项目规则和 Python 检查,例如 AGENTS.md 和 scripts/;agent 的作用是读取、运行并遵守这些规则。
比较好的新手提示词:
请先分类这个任务,再行动。告诉我你需要先读哪些文件。
请先为这个任务运行 runtime preflight,并解释它是 bounded task 还是 formal-writing task。
请检查这个 source 现在是 metadata-only、partly reviewed,还是 citation-ready。没有 source-section review 不要升级状态。
请只在完成 source-first、claim-support、integrity 和 document-quality 检查后,再准备正式文档。
尽量避免这种模糊指令:
帮我改到最好。
更好的方式是说明:这个输出给谁看、用途是什么、可以用哪些 source、哪些地方不能改。
| 文件 | 作用 |
|---|---|
AGENTS.md |
agent 必须遵守的主规则 |
PROJECT_AGENT_PREFERENCES.md |
你的项目偏好和边界 |
RESEARCH_PROJECT_BRIEF_TEMPLATE.md |
项目说明模板 |
PROJECT_TYPE_PROFILES.md |
判断项目类型:论文、报告、grant、evidence synthesis 等 |
docs/TASK_CARDS_CN.md |
帮你在行动前选择最小安全 workflow |
templates/SOURCE_FIRST_INTAKE_CARD.md |
可复制的 intake 表,先明确 source corpus、output surface、evidence boundary 和 gates |
knowledge-base/SOURCE_READINESS_MATRIX.md |
记录 source 是 metadata-only、partly reviewed,还是可以引用 |
research-wiki/TASK_STATE.md |
项目记忆和当前状态 |
research-wiki/STAGE_GRAPH.md |
帮助后续阶段回顾前面阶段的重要决定 |
research-wiki/CLAIM_LEDGER_LITE_PROTOCOL.md |
防止正式 claim 超出证据能支持的范围 |
research-wiki/VISIBLE_OUTPUT_QA_PROTOCOL.md |
要求检查用户真正看到的输出,而不只是检查文件是否生成 |
小任务,应该保持轻量。
例如:
- 查一篇 paper 有没有可用章节;
- 修 citation key;
- 给阅读 source 排优先级;
- 总结现在缺什么。
这类任务不应该自动进入完整 formal-writing chain,除非任务变成正式写作或修改受保护文件。
高风险任务,需要完整检查。
例如:
- 写正式段落;
- 改 thesis / dissertation 章节;
- 准备 report section;
- 写 stakeholder-facing 文档。
agent 应该做 source-first、claim boundary、integrity check、self-review、style check 和 document-quality gate。
用户或读者会看到渲染后的输出。
例如:
- Word 文档;
- PDF;
- figure;
- GitHub README;
- Obsidian graph/page;
- browser page。
这时要用 Visible Output QA。文件存在不等于读者看到的页面是好的。
- 不要把私人数据放进公开 GitHub。
- 不要让 agent 编造 citation 或事实。
- 搜索结果只是候选,不是证据。
- 没有确认的事实保留
TO CONFIRM。 - 用 commit 保存工作节点。
- 重大更新后先跑验证再信任。
设置或大改后,运行:
python scripts/run_skill_evals.py
python scripts/validate_agent_schemas.py
python scripts/session_log_integrity_check.py --strict --no-report
python scripts/codex_sqlite_log_guard.py scan --no-report
python scripts/borrowed_pattern_boundary_lint.py --no-report
python -m unittest discover -s tests
bash scripts/privacy_check.sh如果你不会运行命令,可以直接问 Codex:
请帮我运行这个 starter kit 的基础验证命令,并用普通语言解释结果。
本仓库使用 PolyForm Noncommercial License。允许个人学习、教育和非商业研究使用。未经书面许可,不允许商业使用、转售、付费托管/SaaS、付费培训、咨询产品化,或作为付费产品的一部分再分发。
在分享或复用到个人/教育以外的场景前,请先阅读 LICENSE。
- 下载或 clone 仓库。
- 用 Codex 或其他 coding agent 打开。
- 阅读这份指南和
README_CN.md。 - 创建或自定义
AGENTS.md。 - 如果不知道怎么开始,先读
docs/TASK_CARDS_CN.md。 - 第一个 substantial task 前复制
templates/SOURCE_FIRST_INTAKE_CARD.md。 - 只填写已确认的项目事实。
- 私人材料不要放进公开 GitHub。
- 运行基础验证命令。
- 第一个正式任务前,让 agent 先分类任务,不要直接开写。