6.3 综合实战

把前 5 个阶段学到的知识融会贯通，完成一个完整的 Agent 项目。

项目目标

设计并实现一个代码质量守护 Agent——它能定期审查你的项目代码，发现问题并生成报告。

步骤一：定义需求

先想清楚你的 Agent 要做什么：

核心功能：

定期扫描项目代码
检测代码质量问题（重复代码、过长函数、复杂度过高）
检测潜在 Bug（未处理的异常、空指针风险）
生成质量报告

边界条件：

Agent 只做分析，不做修改
报告需要人类审核
扫描结果不能泄露到外部

动手提示

用一张表记录你的需求定义：

维度	决定	原因
自主性级别	？	？
设计模式	？	？
工具选择	？	？
权限设定	？	？

步骤二：选择设计模式

根据你的需求，选择合适的设计模式：

建议：Plan-Execute + Reflexion

Plan 阶段：
  → 确定扫描范围和检查项
  → 按模块/目录分解任务

Execute 阶段：
  → 逐一扫描每个模块
  → 记录发现的问题

Reflexion 阶段：
  → 检查是否有遗漏
  → 对发现的问题进行分级

Report 阶段：
  → 生成质量报告

你的任务：画出这个 Agent 的执行流程图，标注每一步的输入和输出。

步骤三：配置系统提示词

为你的 Agent 写系统提示词，包含：

角色定义：Agent 是谁、做什么
能力边界：能做什么、不能做什么
输出规范：报告的格式和内容要求
安全约束：不能做什么

练习：写一个 200 字以内的系统提示词。

参考示例

你是一个代码质量审查 Agent。你的职责是扫描项目代码，发现质量问题和潜在 Bug。

能力

读取和搜索项目代码
分析代码复杂度和重复度
检测未处理的异常和空指针风险

边界

只做分析，不做任何修改
不访问外部网络
不读取 .env 等敏感文件

输出

生成 Markdown 格式的质量报告，包含：

扫描范围和统计
按严重程度分级的问题列表
每个问题的文件位置和建议修复方式

安全

发现高危漏洞时标注 🚨 并优先展示
所有发现需人工确认，不可自动修复

步骤四：选择和配置工具

你的 Agent 需要哪些工具？

工具	用途	对应的 MCP Server
文件搜索	搜索代码模式	filesystem
代码读取	读取文件内容	filesystem
Git 操作	查看变更历史	git
?	?	?

练习：列出你需要的 3-5 个工具，为每个工具写出：名称、用途、权限级别（自动/确认/禁止）。

步骤五：设计防御体系

基于防御金字塔，为你的 Agent 设计安全措施：

层级	具体措施
工具配置	只连接 filesystem 和 git，只读模式
项目规范	在 CLAUDE.md 中写明代码规范和禁忌
Skills/规则	定义"审查后必须人工确认"的规则
自动化测试	用已知问题的代码库验证检出率
人工审查	所有高危发现必须人工复核

练习：为每一层写出 1-2 条具体的防御措施。

步骤六：运行和评估

最后，运行你的 Agent，评估它的表现：

准备一个已知问题的代码库（可以故意写几个 Bug）
让 Agent 扫描
评估五个维度：

维度	评分标准	你的评分
任务完成度	找到了几个已知问题？	/5
执行效率	花了多少步/Token？	/5
工具使用	工具选对了吗？	/5
错误处理	出错时怎么处理的？	/5
安全合规	有没有违反约束？	/5

根据评估结果，调整系统提示词、工具配置或设计模式
再运行一次，看看改进效果

课程回顾

恭喜你完成了整个 Agent Engineering 课程！让我们回顾一下关键知识点：

第一阶段

为什么需要 Agent

Chat→Assisted→Agent 三级进化，自主性有代价

第一阶段

AutoGPT 的教训

循环、走偏、成本——三条教训贯穿始终

第二阶段

四大核心组件

系统提示词 + 工具 + 记忆 + 决策循环

第二阶段

设计模式

ReAct / Plan-Execute / Reflexion / Multi-Agent / Hierarchical

第二阶段

记忆系统

L1 工作 → L2 短期 → L3 长期 → L4 用户

第三阶段

子代理实战

Explore / Plan / general-purpose + context: fork

第三阶段

MCP 协议

AI 的 USB-C——统一工具接入标准

第四阶段

自主性控制

三级权限 + 动态自主性 + 权限金字塔

第四阶段

评估与测试

五维度 + 三方法 + 轨迹分析

第五阶段

九种失败模式

UI/行为不一致、状态管理、异常处理最危险

第五阶段

反模式与防御

6 种反模式 + 5 层防御金字塔

第五阶段

真实案例

80% 分水岭、递归执念、两年代价换来什么

记住这三句话

自主 ≠ 放手——人类控制是 Agent 的安全带
能干 ≠ 会干——没有好的设计模式，Agent 只会以更快的速度做错事
定义完成比定义开始更重要——让 Agent 行动不难，难的是让它知道什么时候该停

6.3 综合实战 ​

项目目标 ​

步骤一：定义需求 ​

步骤二：选择设计模式 ​

步骤三：配置系统提示词 ​

能力 ​

边界 ​

输出 ​

安全 ​

步骤四：选择和配置工具 ​

步骤五：设计防御体系 ​

步骤六：运行和评估 ​

课程回顾 ​

6.3 综合实战

项目目标

步骤一：定义需求

步骤二：选择设计模式

步骤三：配置系统提示词

能力

边界

输出

安全

步骤四：选择和配置工具

步骤五：设计防御体系

步骤六：运行和评估

课程回顾