一份从 LLM 基础到生产级 Agent 系统的完整开源学习路线图。
Agent Learning(agent_learning)是一个系统、实战导向的 AI Agent 学习路线图与动手教程,覆盖 LLM 基础、RAG、记忆系统、工具调用、Function Calling、Agentic Workflow、LangChain、LangGraph、MCP、多智能体系统、评估、部署和 Agentic RL。
如果你想系统学习如何构建 AI Agent,而不只是会用 ChatGPT,本项目会从 LLM 基础讲到 RAG、Memory、Tool Use、Planning、多 Agent、LangGraph、MCP、部署评估与生产级 Agent 系统。
每日自动追踪 arXiv 前沿论文,内容持续更新,始终紧跟最新进展
每日更新的 Agentic-RL 前沿研究章节 |
循序渐进的 GRPO / GSPO 学习内容 |
🤖 本仓库每天自动搜索 arXiv 上最新的 AI Agent 相关论文,并将内容自动更新到对应章节 —— 确保你始终紧跟研究前沿!
- 📡 每日自动检索:定时流水线每天扫描 arXiv 上关于 Agent 架构、工具使用、记忆系统、多智能体协作、强化学习等方向的最新论文。
- 📝 内容自动更新:相关研究成果自动整合到对应章节,保持前沿内容的时效性与新鲜度。
- 🔔 不错过任何突破:无需手动追踪大量研究源,本仓库自动完成,让你专注于学习和构建。
💡 这意味着你在这里阅读的内容不是静态的 —— 它会随着 AI Agent 领域的最新进展持续演进。
- 开发者:想真正构建 AI Agent 应用,而不只是写 Prompt 调聊天机器人
- 学生和初学者:需要一条从 LLM 基础到 Agent 系统的系统学习路径
- LLM 应用工程师:正在实践 RAG、工具调用、记忆系统、LangGraph、MCP 和评估
- 研究者和技术创作者:希望把前沿 Agent 论文和工程实践连接起来
- 产品和创业团队:想理解生产级 Agent 工作流如何设计与落地
如果你不知道从哪里开始,可以直接按下面的目标选择阅读顺序。
| 你的目标 | 推荐阅读路线 |
|---|---|
| 快速理解 Agent 是什么 | 第 1 章 Agent 基础 → 第 2 章大语言模型基础 → 第 3 章工具调用 → 第 5.2 节 ReAct → 附录 F.4 Hello Agent |
| 了解大模型,并学习使用 Codex、Claude Code 等 AI 编程工具 | 第 2 章大语言模型基础 → 第 2.2 节 Prompt Engineering → 第 2.4 节模型 API 调用入门 → 第 14 章 Claude Code 深度解析 → 第 20 章 AI 编程助手 |
| 构建一个能用的 Agent 应用 | 第 3 章工具调用 → 第 4 章记忆系统 → 第 5 章规划与推理 → 第 6 章 RAG → 第 7 章上下文工程 → 第 8 章 Harness Engineering |
| 把 Agent 上线到生产环境 | 第 8 章 Harness Engineering → 第 17 章评估与优化 → 第 18 章安全与可靠性 → 第 19 章部署与生产化 |
| 掌握 LangChain / LangGraph 等框架 | 第 3 章工具调用 → 第 5 章规划与推理 → 第 6 章 RAG → 第 11 章 LangChain → 第 12 章 LangGraph → 第 13 章框架概览 |
| 理解 Agent 前沿论文和研究脉络 | 第 5.2 节 ReAct → 第 5.4 节反思机制 → 第 5.7 节规划论文解读 → 第 4.6 节记忆论文解读 → 第 6.6 节 RAG 论文解读 → 第 15.6 节多 Agent 论文解读 |
| 学习 Agentic-RL 和自我进化 | 第 2.8 节训练数据准备 → 第 10.1 节 Agentic-RL → 第 10.4 节 DPO → 第 10.5 节 GRPO / GSPO → 第 10.8 节 Agent 微调 → 第 10.9 节数据飞轮 → 第 10.10 节 Self-Evolution Agent |
| 边做项目边学习 | 附录 F 开发环境搭建 → 第 3 章工具调用 → 第 6 章 RAG → 第 12 章 LangGraph → 第 20 章 AI 编程助手 → 第 21 章数据分析 Agent → 第 22 章多模态 Agent |
- 🎯 循序渐进:从 LLM 基础到多 Agent 系统,每章都有清晰的知识脉络
- 💻 代码优先:每个核心概念都配有可运行的 Python 代码示例
- 🎨 图文并茂:120+ 手绘 SVG 架构图 / 流程图 / 时序图,直观理解复杂概念
- 🎬 交互动画:内置 5 个交互式 HTML 动画(感知-思考-行动循环、ReAct 推理、Function Calling、RAG 流程、GRPO 采样)
- 🔬 论文解读:关键章节附有前沿论文精读(ReAct、Reflexion、MemGPT、GRPO 等),帮你跟上学术最新进展
- 🏗️ 完整项目:3 个综合实战项目(AI 编程助手、智能数据分析 Agent、多模态 Agent)
- 🛡️ 生产就绪:涵盖安全、评估、部署等生产环境必备知识
- 🧪 前沿技术:涵盖上下文工程、Agentic-RL(GRPO/DPO/PPO)、MCP/A2A/ANP 等 2025—2026 最新进展
- 📐 公式支持:使用 KaTeX 渲染数学公式,强化学习章节可清晰阅读策略梯度、KL 散度等公式推导
- 🔄 持续更新:跟踪 LangChain、LangGraph、MCP 等框架的最新变化
以下是本书 120+ 手绘 SVG 插图中的精选展示,所有图示均为本书原创。
|
感知-思考-行动循环(第 1 章) Agent 的核心运行机制:感知环境 → LLM 推理决策 → 执行行动 → 循环直到目标达成 |
ReAct 推理框架(第 5 章) Thought → Action → Observation 交替循环,让 Agent 边思考边行动 |
|
Function Calling 完整流程(第 3 章) 从用户输入到工具调用再到最终回复的 6 步完整流程,附消息结构示意 |
RAG 检索增强生成(第 6 章) 离线建库 + 在线检索双阶段架构,让 LLM 回答有据可查 |
|
记忆系统三层架构(第 4 章) 工作记忆 → 短期记忆 → 长期记忆,重要信息向下沉淀、语义检索向上提取 |
提示工程 vs 上下文工程(第 7 章) 从"如何说"到"让 LLM 看到什么"——Agent 时代的范式升级 |
|
多 Agent 三种通信模式(第 15 章) 消息队列(异步解耦)/ 共享黑板(数据共享)/ 直接调用(实时协作) |
MCP / A2A / ANP 三协议对比(第 16 章) 三层协议栈各司其职:ANP 组网发现 → A2A 任务协作 → MCP 工具调用 |
|
GRPO 训练架构(第 10 章) 无需 Critic 模型,通过组内标准化计算优势值,显存仅需 1.5× 模型大小 |
LangGraph 三大核心概念(第 12 章) State(共享状态)· Node(处理单元)· Edge(执行流控制) |
📖 以上仅为精选预览 — 完整的 120+ 张架构图 + 5 个交互动画,请 在线阅读 体验
本书内置了 5 个可交互的 HTML 动画,帮助你直观理解核心概念的动态过程:
| 动画 | 对应章节 | 说明 |
|---|---|---|
| 🔄 感知-思考-行动循环 | 第 1 章 | 动态演示 Agent 的核心运行循环 |
| 💡 ReAct 推理过程 | 第 5 章 | 展示 Thought → Action → Observation 的交替过程 |
| 🔧 Function Calling | 第 3 章 | 工具调用的完整流程动画 |
| 📚 RAG 检索流程 | 第 6 章 | 从文档切分到向量检索再到生成回答 |
| 🎯 GRPO 采样过程 | 第 10 章 | 组内多输出采样与奖励标准化的可视化 |
💡 交互动画仅在 在线电子书 中可体验,本地构建也可预览。
|
🧠 Agent 核心架构
🛠️ 工具与技能
🧪 强化学习训练
|
💾 记忆、知识与上下文
🤝 多 Agent 协作 & 通信
🛡️ 生产化全链路
|
# 安装 mdBook(二选一)
cargo install mdbook
# 或 macOS:brew install mdbook
# 安装 mdbook-katex 插件(用于数学公式渲染)
cargo install mdbook-katex
# 克隆仓库
git clone https://github.com/Haozhe-Xing/agent_learning.git
cd agent_learning
# 构建中英文版本并启动统一服务(默认端口 3000)
./serve.sh启动后访问:
- 🌐 语言选择首页:
http://localhost:3000 - 🇨🇳 中文版:
http://localhost:3000/zh/ - 🇺🇸 English:
http://localhost:3000/en/
# Python 3.11+
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 安装核心依赖
pip install langchain langchain-openai langgraph openai anthropic
# 配置 API Key
export OPENAI_API_KEY="your-key-here"欢迎任何形式的贡献!
- 🐛 发现错误:提交 Issue
- 💡 内容建议:发起 Discussion
- 📝 改进内容:Fork → 修改 → 提交 PR
- ⭐ 支持项目:给本仓库点个 Star!
# Fork 并克隆
git clone https://github.com/YOUR_USERNAME/agent_learning.git
# 创建特性分支
git checkout -b feature/improve-chapter-3
# 本地预览
./serve.sh
# 提交并推送
git commit -m "feat: 改进第3章工具调用示例代码"
git push origin feature/improve-chapter-3- 每章内容放在独立目录
src/zh/chapter_xxx/(中文)或src/en/chapter_xxx/(英文)下 - 章节概述放在
README.md,各小节按01_xxx.md、02_xxx.md编号 - 中文版 SVG 插图放在
src/zh/svg/,英文版放在src/en/svg/,命名格式chapter_xxx_描述.svg - 中文版交互动画放在
src/zh/animations/,英文版放在src/en/animations/
所有论文解读和前沿进展章节应采用统一结构,帮助读者快速理解一篇论文为什么重要、当时解决了什么问题,以及它如何影响真实 Agent 工程。
每篇代表性论文建议使用以下模板:
### 论文名:一句话说明它解决什么问题
- **论文链接**:
- **代码 / 项目链接**:
- **发表时间 / 机构**:
- **当时解决的问题**:
- **核心贡献**:
- **方法拆解**:
- **对 Agent 工程的启发**:
- **局限性**:质量要求:
- 链接到原始来源:优先提供 arXiv、会议页面、官方博客、GitHub 或项目主页。
- 说明历史贡献:不要只说论文做了什么,还要说明它在发表时解决了什么关键问题。
- 连接工程实践:说明该工作对 Agent 记忆、工具、规划、评估、安全、训练或部署有什么启发。
- 写清局限性:说明论文没有解决什么、依赖哪些强假设,或者是否主要是 benchmark 驱动。
- 避免只堆论文列表:多篇论文之后,应补充对比表或脉络小结,说明这些工作之间的关系。
本项目采用 MIT License 开源协议。
- 基于 mdBook 的中英文在线书
- 120+ 原创 SVG 架构图和流程图
- Agent 核心概念交互式动画
- 关键 Agent 论文精读章节
- 覆盖 PPO / DPO / GRPO 的 Agentic RL 内容
- 可运行 Agent 示例项目和模板
- Agent 术语表与关键词速查表
- Agent 架构图合集
- 面试题和自测题
- 带评估与可观测性的生产级 Agent 模板
如果这个项目对你有帮助,请给个 Star ⭐,这是对作者最大的鼓励!
用 ❤️ 构建,为了让每个开发者都能掌握 AI Agent 开发

