6.2 设计题——给真实场景设计方案
用以下场景练习 Skill 和 Agent 的分工设计。
场景 1:代码审查自动化⭐⭐ 中等
你的团队每天有 10+ 个 PR 需要审查,审查标准包括安全、性能、代码风格。你希望 AI 能辅助审查,减少人工负担。
设计要求
- AI 按团队标准逐项检查代码
- 能发现标准未覆盖的潜在问题
- 审查结果发布到 PR 评论
- 不自动合并代码
请回答
- 用三问法判断:哪些需求用 Skill?哪些用 Agent?
- 如果用 Skill + Agent 协同,用哪种协同模式?
- 可能的失效模式有哪些?如何预防?
参考方案
三问法分析:
- "AI 需要遵循特定的标准?" → 是 → Skill
- "任务是开放性的、步骤不可预定义?" → 是(发现未知问题)→ Agent
- 两者都需要 → Skill + Agent 协同
协同模式:模式 3(深度融合)
Skill 定义:
- 审查清单(SQL 注入、XSS、CSRF、认证、授权...)
- 审查流程(先安全后性能再风格)
- 输出格式(严重程度 + 代码位置 + 修复建议)
- 安全护栏("不自动合并代码")
Agent 执行:
- 按 Skill 清单逐项检查
- 自主发现 Skill 未覆盖的潜在问题
- 发布审查评论
- 受 Skill 护栏约束,不越权操作
失效模式:
- Skill 软失效:AI 跳过某些检查项 → 加强措辞、添加自检
- Agent 走偏:在某个文件花太多时间 → 限制每文件最大循环次数
- 协同失效:Agent 忽略了"不自动合并" → 护栏设在代码层(权限金字塔)
场景 2:批量修复 API 错误处理⭐⭐⭐ 困难
你的项目有 50+ 个 API 端点,错误处理不统一。你希望 AI 能搜索所有端点、分析现有错误处理模式、逐个修复。
设计要求
- AI 自主搜索和遍历所有 API 端点
- 按统一标准修复错误处理
- 不修改业务逻辑
- 修复后运行测试验证
请回答
- 这个场景适合只用 Skill、只用 Agent、还是 Skill + Agent 协同?
- Skill 应该定义什么?Agent 应该做什么?
- Agent 可能的失控类型有哪些?如何防御?
参考方案
判断:Skill + Agent 协同(模式 2:Agent 主导)
分析:任务是开放性的——50+ 个端点的错误处理模式不统一,需要 Agent 自主搜索、分析、逐个修复。但需要 Skill 定义"统一标准"和"安全约束"。
Skill 定义:
- 统一错误处理标准(try-catch 模式、错误码规范)
- 安全约束("不修改业务逻辑"、"不改变 API 签名")
- 修复后必须运行测试
Agent 执行:
- 搜索所有 API 端点
- 分析现有错误处理模式
- 按 Skill 标准逐个修复
- 修复后运行测试
Agent 失控防御:
- 无限循环 → 限制最大修复 50 个端点
- 走偏 → 每个修复后检查与目标的偏离度
- 越权操作 → 权限金字塔:禁止修改业务逻辑
- 成本爆炸 → token 止损线
场景 3:合规代码审查⭐⭐⭐⭐ 专家
你的金融团队需要 AI 对每次提交的代码进行合规审查,审查标准来自监管文件,审查结果需要留痕。
设计要求
- AI 按监管标准审查代码
- 审查结果存档,可追溯
- 不合规的代码自动阻止合并
- 审查标准随监管更新
请回答
- 哪些需求属于 Skill?哪些属于 Agent?
- Skill 和 Agent 如何保证合规留痕?
- 用哪种协同模式?为什么?
参考方案
Skill:
- 监管审查标准(数据隐私、交易安全、审计日志...)
- 审查流程(逐项检查、按严重程度分类)
- 输出格式(合规/不合规、具体条款引用)
Agent:
- 按 Skill 标准自主审查代码
- 自主发现标准未覆盖的合规风险
- 存储审查结果(操作留痕)
- 阻止不合规代码合并
协同模式:模式 3(深度融合)
留痕策略:Agent 的行为日志完整记录每一步决策(可审计)+ Skill 的审查标准文档(合规依据)+ MCP 工具调用记录(操作留痕)
场景 4:自动化部署流水线⭐⭐⭐ 困难
你的团队需要 AI 辅助部署——监控环境状态、满足条件自动部署、异常时自主判断回滚策略。
设计要求
- AI 监控部署环境状态
- 满足条件时自动部署
- 异常时自主判断回滚策略
- 部署操作需要留痕
请回答
- 这个场景用 Skill 还是用 Agent?为什么?
- 如果用 Skill + Agent,Skill 定义什么护栏?
- Agent 的失控风险有哪些?如何防御?
参考方案
判断:Skill + Agent 协同(模式 2:Agent 主导)
Skill 定义护栏:
- 部署禁忌("不要在数据库迁移期间部署"、"不要跳过测试")
- 操作顺序("先测试 → 再构建 → 再部署 → 再验证")
- 紧急处理规则("回滚失败 → 通知人工")
Agent 执行:
- 监控环境状态
- 满足条件自主部署
- 异常时判断回滚策略
- 部署操作记录留痕
失控防御:
- 越权操作 → 权限金字塔:部署到生产需审批
- 走偏 → 每步检查与部署目标的偏离度
- 级联失败 → 部署 Agent 和回滚 Agent 独立沙箱
- 成本爆炸 → 部署超时自动停止
场景 5:智能客户支持⭐⭐ 中等
你的客服团队每天收到 100+ 工单。你希望 AI 能自主理解问题、查询知识库、生成回复、更新工单状态。简单问题自动处理,复杂问题升级人工。
设计要求
- AI 自主理解客户问题
- 查询知识库生成回复
- 简单问题自动处理,复杂问题升级人工
- 不说承诺退款、不透露内部信息
请回答
- 哪些需求属于 Skill?哪些属于 Agent?
- 如何保证 AI 不会说出不该说的话?
- 用哪种协同模式?
参考方案
Skill:
- 回复规范(语气、模板、常见问题)
- 回复禁忌("不要承诺退款"、"不要透露内部系统信息")
- 升级规则(什么情况转人工)
- 输出格式
Agent:
- 自主理解客户问题
- 查询知识库
- 生成回复
- 更新工单状态
防止 AI 说不该说的话:护栏设在 Agent 代码层——在发布回复前自动检查是否违反禁忌列表。不只是提示词层,因为 Agent 可能绕过提示词约束。
协同模式:模式 2(Agent 主导)+ Skill 做安全带
本节核心要点
- 场景 1(代码审查):深度融合——知识和自主发现同等重要
- 场景 2(批量修复):Agent 主导——操作是核心,Skill 做护栏
- 场景 3(合规审查):深度融合——知识和留痕同等重要
- 场景 4(部署流水线):Agent 主导——自主决策是核心,Skill 做禁忌
- 场景 5(客户支持):Agent 主导——自主理解是核心,Skill 做安全带
← 上一节:概念题 | 目录 | 下一节:综合实战 →