6.3 综合实战
把前 5 个阶段学到的知识融会贯通,完成一个完整的 Agent 项目。
项目目标
设计并实现一个代码质量守护 Agent——它能定期审查你的项目代码,发现问题并生成报告。
步骤一:定义需求
先想清楚你的 Agent 要做什么:
核心功能:
- 定期扫描项目代码
- 检测代码质量问题(重复代码、过长函数、复杂度过高)
- 检测潜在 Bug(未处理的异常、空指针风险)
- 生成质量报告
边界条件:
- Agent 只做分析,不做修改
- 报告需要人类审核
- 扫描结果不能泄露到外部
动手提示
用一张表记录你的需求定义:
| 维度 | 决定 | 原因 |
|---|---|---|
| 自主性级别 | ? | ? |
| 设计模式 | ? | ? |
| 工具选择 | ? | ? |
| 权限设定 | ? | ? |
步骤二:选择设计模式
根据你的需求,选择合适的设计模式:
建议:Plan-Execute + Reflexion
Plan 阶段:
→ 确定扫描范围和检查项
→ 按模块/目录分解任务
Execute 阶段:
→ 逐一扫描每个模块
→ 记录发现的问题
Reflexion 阶段:
→ 检查是否有遗漏
→ 对发现的问题进行分级
Report 阶段:
→ 生成质量报告你的任务:画出这个 Agent 的执行流程图,标注每一步的输入和输出。
步骤三:配置系统提示词
为你的 Agent 写系统提示词,包含:
- 角色定义:Agent 是谁、做什么
- 能力边界:能做什么、不能做什么
- 输出规范:报告的格式和内容要求
- 安全约束:不能做什么
练习:写一个 200 字以内的系统提示词。
参考示例
你是一个代码质量审查 Agent。你的职责是扫描项目代码,发现质量问题和潜在 Bug。
能力
- 读取和搜索项目代码
- 分析代码复杂度和重复度
- 检测未处理的异常和空指针风险
边界
- 只做分析,不做任何修改
- 不访问外部网络
- 不读取 .env 等敏感文件
输出
生成 Markdown 格式的质量报告,包含:
- 扫描范围和统计
- 按严重程度分级的问题列表
- 每个问题的文件位置和建议修复方式
安全
- 发现高危漏洞时标注 🚨 并优先展示
- 所有发现需人工确认,不可自动修复
步骤四:选择和配置工具
你的 Agent 需要哪些工具?
| 工具 | 用途 | 对应的 MCP Server |
|---|---|---|
| 文件搜索 | 搜索代码模式 | filesystem |
| 代码读取 | 读取文件内容 | filesystem |
| Git 操作 | 查看变更历史 | git |
| ? | ? | ? |
练习:列出你需要的 3-5 个工具,为每个工具写出:名称、用途、权限级别(自动/确认/禁止)。
步骤五:设计防御体系
基于防御金字塔,为你的 Agent 设计安全措施:
| 层级 | 具体措施 |
|---|---|
| 工具配置 | 只连接 filesystem 和 git,只读模式 |
| 项目规范 | 在 CLAUDE.md 中写明代码规范和禁忌 |
| Skills/规则 | 定义"审查后必须人工确认"的规则 |
| 自动化测试 | 用已知问题的代码库验证检出率 |
| 人工审查 | 所有高危发现必须人工复核 |
练习:为每一层写出 1-2 条具体的防御措施。
步骤六:运行和评估
最后,运行你的 Agent,评估它的表现:
- 准备一个已知问题的代码库(可以故意写几个 Bug)
- 让 Agent 扫描
- 评估五个维度:
| 维度 | 评分标准 | 你的评分 |
|---|---|---|
| 任务完成度 | 找到了几个已知问题? | /5 |
| 执行效率 | 花了多少步/Token? | /5 |
| 工具使用 | 工具选对了吗? | /5 |
| 错误处理 | 出错时怎么处理的? | /5 |
| 安全合规 | 有没有违反约束? | /5 |
- 根据评估结果,调整系统提示词、工具配置或设计模式
- 再运行一次,看看改进效果
课程回顾
恭喜你完成了整个 Agent Engineering 课程!让我们回顾一下关键知识点:
第一阶段
为什么需要 Agent
Chat→Assisted→Agent 三级进化,自主性有代价
第一阶段
AutoGPT 的教训
循环、走偏、成本——三条教训贯穿始终
第二阶段
四大核心组件
系统提示词 + 工具 + 记忆 + 决策循环
第二阶段
设计模式
ReAct / Plan-Execute / Reflexion / Multi-Agent / Hierarchical
第二阶段
记忆系统
L1 工作 → L2 短期 → L3 长期 → L4 用户
第三阶段
子代理实战
Explore / Plan / general-purpose + context: fork
第三阶段
MCP 协议
AI 的 USB-C——统一工具接入标准
第四阶段
自主性控制
三级权限 + 动态自主性 + 权限金字塔
第四阶段
评估与测试
五维度 + 三方法 + 轨迹分析
第五阶段
九种失败模式
UI/行为不一致、状态管理、异常处理最危险
第五阶段
反模式与防御
6 种反模式 + 5 层防御金字塔
第五阶段
真实案例
80% 分水岭、递归执念、两年代价换来什么
记住这三句话
- 自主 ≠ 放手——人类控制是 Agent 的安全带
- 能干 ≠ 会干——没有好的设计模式,Agent 只会以更快的速度做错事
- 定义完成比定义开始更重要——让 Agent 行动不难,难的是让它知道什么时候该停