Skip to content

6.2 设计题——给真实场景设计方案

用以下场景练习 Skill 和 Agent 的分工设计。


📄场景 1:代码审查自动化⭐⭐ 中等
你的团队每天有 10+ 个 PR 需要审查,审查标准包括安全、性能、代码风格。你希望 AI 能辅助审查,减少人工负担。

设计要求

  • AI 按团队标准逐项检查代码
  • 能发现标准未覆盖的潜在问题
  • 审查结果发布到 PR 评论
  • 不自动合并代码

请回答

  1. 用三问法判断:哪些需求用 Skill?哪些用 Agent?
  2. 如果用 Skill + Agent 协同,用哪种协同模式?
  3. 可能的失效模式有哪些?如何预防?
参考方案

三问法分析

  • "AI 需要遵循特定的标准?" → 是 → Skill
  • "任务是开放性的、步骤不可预定义?" → 是(发现未知问题)→ Agent
  • 两者都需要 → Skill + Agent 协同

协同模式:模式 3(深度融合)

Skill 定义

  • 审查清单(SQL 注入、XSS、CSRF、认证、授权...)
  • 审查流程(先安全后性能再风格)
  • 输出格式(严重程度 + 代码位置 + 修复建议)
  • 安全护栏("不自动合并代码")

Agent 执行

  • 按 Skill 清单逐项检查
  • 自主发现 Skill 未覆盖的潜在问题
  • 发布审查评论
  • 受 Skill 护栏约束,不越权操作

失效模式

  • Skill 软失效:AI 跳过某些检查项 → 加强措辞、添加自检
  • Agent 走偏:在某个文件花太多时间 → 限制每文件最大循环次数
  • 协同失效:Agent 忽略了"不自动合并" → 护栏设在代码层(权限金字塔)

🚨场景 2:批量修复 API 错误处理⭐⭐⭐ 困难
你的项目有 50+ 个 API 端点,错误处理不统一。你希望 AI 能搜索所有端点、分析现有错误处理模式、逐个修复。

设计要求

  • AI 自主搜索和遍历所有 API 端点
  • 按统一标准修复错误处理
  • 不修改业务逻辑
  • 修复后运行测试验证

请回答

  1. 这个场景适合只用 Skill、只用 Agent、还是 Skill + Agent 协同?
  2. Skill 应该定义什么?Agent 应该做什么?
  3. Agent 可能的失控类型有哪些?如何防御?
参考方案

判断:Skill + Agent 协同(模式 2:Agent 主导)

分析:任务是开放性的——50+ 个端点的错误处理模式不统一,需要 Agent 自主搜索、分析、逐个修复。但需要 Skill 定义"统一标准"和"安全约束"。

Skill 定义

  • 统一错误处理标准(try-catch 模式、错误码规范)
  • 安全约束("不修改业务逻辑"、"不改变 API 签名")
  • 修复后必须运行测试

Agent 执行

  • 搜索所有 API 端点
  • 分析现有错误处理模式
  • 按 Skill 标准逐个修复
  • 修复后运行测试

Agent 失控防御

  • 无限循环 → 限制最大修复 50 个端点
  • 走偏 → 每个修复后检查与目标的偏离度
  • 越权操作 → 权限金字塔:禁止修改业务逻辑
  • 成本爆炸 → token 止损线

🔒场景 3:合规代码审查⭐⭐⭐⭐ 专家
你的金融团队需要 AI 对每次提交的代码进行合规审查,审查标准来自监管文件,审查结果需要留痕。

设计要求

  • AI 按监管标准审查代码
  • 审查结果存档,可追溯
  • 不合规的代码自动阻止合并
  • 审查标准随监管更新

请回答

  1. 哪些需求属于 Skill?哪些属于 Agent?
  2. Skill 和 Agent 如何保证合规留痕?
  3. 用哪种协同模式?为什么?
参考方案

Skill

  • 监管审查标准(数据隐私、交易安全、审计日志...)
  • 审查流程(逐项检查、按严重程度分类)
  • 输出格式(合规/不合规、具体条款引用)

Agent

  • 按 Skill 标准自主审查代码
  • 自主发现标准未覆盖的合规风险
  • 存储审查结果(操作留痕)
  • 阻止不合规代码合并

协同模式:模式 3(深度融合)

留痕策略:Agent 的行为日志完整记录每一步决策(可审计)+ Skill 的审查标准文档(合规依据)+ MCP 工具调用记录(操作留痕)


🚀场景 4:自动化部署流水线⭐⭐⭐ 困难
你的团队需要 AI 辅助部署——监控环境状态、满足条件自动部署、异常时自主判断回滚策略。

设计要求

  • AI 监控部署环境状态
  • 满足条件时自动部署
  • 异常时自主判断回滚策略
  • 部署操作需要留痕

请回答

  1. 这个场景用 Skill 还是用 Agent?为什么?
  2. 如果用 Skill + Agent,Skill 定义什么护栏?
  3. Agent 的失控风险有哪些?如何防御?
参考方案

判断:Skill + Agent 协同(模式 2:Agent 主导)

Skill 定义护栏

  • 部署禁忌("不要在数据库迁移期间部署"、"不要跳过测试")
  • 操作顺序("先测试 → 再构建 → 再部署 → 再验证")
  • 紧急处理规则("回滚失败 → 通知人工")

Agent 执行

  • 监控环境状态
  • 满足条件自主部署
  • 异常时判断回滚策略
  • 部署操作记录留痕

失控防御

  • 越权操作 → 权限金字塔:部署到生产需审批
  • 走偏 → 每步检查与部署目标的偏离度
  • 级联失败 → 部署 Agent 和回滚 Agent 独立沙箱
  • 成本爆炸 → 部署超时自动停止

💬场景 5:智能客户支持⭐⭐ 中等
你的客服团队每天收到 100+ 工单。你希望 AI 能自主理解问题、查询知识库、生成回复、更新工单状态。简单问题自动处理,复杂问题升级人工。

设计要求

  • AI 自主理解客户问题
  • 查询知识库生成回复
  • 简单问题自动处理,复杂问题升级人工
  • 不说承诺退款、不透露内部信息

请回答

  1. 哪些需求属于 Skill?哪些属于 Agent?
  2. 如何保证 AI 不会说出不该说的话?
  3. 用哪种协同模式?
参考方案

Skill

  • 回复规范(语气、模板、常见问题)
  • 回复禁忌("不要承诺退款"、"不要透露内部系统信息")
  • 升级规则(什么情况转人工)
  • 输出格式

Agent

  • 自主理解客户问题
  • 查询知识库
  • 生成回复
  • 更新工单状态

防止 AI 说不该说的话:护栏设在 Agent 代码层——在发布回复前自动检查是否违反禁忌列表。不只是提示词层,因为 Agent 可能绕过提示词约束。

协同模式:模式 2(Agent 主导)+ Skill 做安全带


本节核心要点

  • 场景 1(代码审查):深度融合——知识和自主发现同等重要
  • 场景 2(批量修复):Agent 主导——操作是核心,Skill 做护栏
  • 场景 3(合规审查):深度融合——知识和留痕同等重要
  • 场景 4(部署流水线):Agent 主导——自主决策是核心,Skill 做禁忌
  • 场景 5(客户支持):Agent 主导——自主理解是核心,Skill 做安全带

← 上一节:概念题 | 目录 | 下一节:综合实战 →