Skip to content

6.3 综合实战

把前 5 个阶段学到的知识融会贯通,完成一个完整的 Agent 项目。


项目目标

设计并实现一个代码质量守护 Agent——它能定期审查你的项目代码,发现问题并生成报告。


步骤一:定义需求

先想清楚你的 Agent 要做什么:

核心功能

  • 定期扫描项目代码
  • 检测代码质量问题(重复代码、过长函数、复杂度过高)
  • 检测潜在 Bug(未处理的异常、空指针风险)
  • 生成质量报告

边界条件

  • Agent 只做分析,不做修改
  • 报告需要人类审核
  • 扫描结果不能泄露到外部

动手提示

用一张表记录你的需求定义:

维度决定原因
自主性级别
设计模式
工具选择
权限设定

步骤二:选择设计模式

根据你的需求,选择合适的设计模式:

建议:Plan-Execute + Reflexion

Plan 阶段:
  → 确定扫描范围和检查项
  → 按模块/目录分解任务

Execute 阶段:
  → 逐一扫描每个模块
  → 记录发现的问题

Reflexion 阶段:
  → 检查是否有遗漏
  → 对发现的问题进行分级

Report 阶段:
  → 生成质量报告

你的任务:画出这个 Agent 的执行流程图,标注每一步的输入和输出。


步骤三:配置系统提示词

为你的 Agent 写系统提示词,包含:

  1. 角色定义:Agent 是谁、做什么
  2. 能力边界:能做什么、不能做什么
  3. 输出规范:报告的格式和内容要求
  4. 安全约束:不能做什么

练习:写一个 200 字以内的系统提示词。

参考示例

你是一个代码质量审查 Agent。你的职责是扫描项目代码,发现质量问题和潜在 Bug。

能力

  • 读取和搜索项目代码
  • 分析代码复杂度和重复度
  • 检测未处理的异常和空指针风险

边界

  • 只做分析,不做任何修改
  • 不访问外部网络
  • 不读取 .env 等敏感文件

输出

生成 Markdown 格式的质量报告,包含:

  • 扫描范围和统计
  • 按严重程度分级的问题列表
  • 每个问题的文件位置和建议修复方式

安全

  • 发现高危漏洞时标注 🚨 并优先展示
  • 所有发现需人工确认,不可自动修复

步骤四:选择和配置工具

你的 Agent 需要哪些工具?

工具用途对应的 MCP Server
文件搜索搜索代码模式filesystem
代码读取读取文件内容filesystem
Git 操作查看变更历史git
???

练习:列出你需要的 3-5 个工具,为每个工具写出:名称、用途、权限级别(自动/确认/禁止)。


步骤五:设计防御体系

基于防御金字塔,为你的 Agent 设计安全措施:

层级具体措施
工具配置只连接 filesystem 和 git,只读模式
项目规范在 CLAUDE.md 中写明代码规范和禁忌
Skills/规则定义"审查后必须人工确认"的规则
自动化测试用已知问题的代码库验证检出率
人工审查所有高危发现必须人工复核

练习:为每一层写出 1-2 条具体的防御措施。


步骤六:运行和评估

最后,运行你的 Agent,评估它的表现:

  1. 准备一个已知问题的代码库(可以故意写几个 Bug)
  2. 让 Agent 扫描
  3. 评估五个维度:
维度评分标准你的评分
任务完成度找到了几个已知问题?/5
执行效率花了多少步/Token?/5
工具使用工具选对了吗?/5
错误处理出错时怎么处理的?/5
安全合规有没有违反约束?/5
  1. 根据评估结果,调整系统提示词、工具配置或设计模式
  2. 再运行一次,看看改进效果

课程回顾

恭喜你完成了整个 Agent Engineering 课程!让我们回顾一下关键知识点:

第一阶段
为什么需要 Agent
Chat→Assisted→Agent 三级进化,自主性有代价
第一阶段
AutoGPT 的教训
循环、走偏、成本——三条教训贯穿始终
第二阶段
四大核心组件
系统提示词 + 工具 + 记忆 + 决策循环
第二阶段
设计模式
ReAct / Plan-Execute / Reflexion / Multi-Agent / Hierarchical
第二阶段
记忆系统
L1 工作 → L2 短期 → L3 长期 → L4 用户
第三阶段
子代理实战
Explore / Plan / general-purpose + context: fork
第三阶段
MCP 协议
AI 的 USB-C——统一工具接入标准
第四阶段
自主性控制
三级权限 + 动态自主性 + 权限金字塔
第四阶段
评估与测试
五维度 + 三方法 + 轨迹分析
第五阶段
九种失败模式
UI/行为不一致、状态管理、异常处理最危险
第五阶段
反模式与防御
6 种反模式 + 5 层防御金字塔
第五阶段
真实案例
80% 分水岭、递归执念、两年代价换来什么

记住这三句话

  1. 自主 ≠ 放手——人类控制是 Agent 的安全带
  2. 能干 ≠ 会干——没有好的设计模式,Agent 只会以更快的速度做错事
  3. 定义完成比定义开始更重要——让 Agent 行动不难,难的是让它知道什么时候该停