6.2 设计题——给真实场景设计方案

用以下场景练习 Skill 和 Agent 的分工设计。

📄场景 1：代码审查自动化⭐⭐ 中等

你的团队每天有 10+ 个 PR 需要审查，审查标准包括安全、性能、代码风格。你希望 AI 能辅助审查，减少人工负担。

设计要求

AI 按团队标准逐项检查代码
能发现标准未覆盖的潜在问题
审查结果发布到 PR 评论
不自动合并代码

请回答

用三问法判断：哪些需求用 Skill？哪些用 Agent？
如果用 Skill + Agent 协同，用哪种协同模式？
可能的失效模式有哪些？如何预防？

参考方案

三问法分析：

"AI 需要遵循特定的标准？" → 是 → Skill
"任务是开放性的、步骤不可预定义？" → 是（发现未知问题）→ Agent
两者都需要 → Skill + Agent 协同

协同模式：模式 3（深度融合）

Skill 定义：

审查清单（SQL 注入、XSS、CSRF、认证、授权...）
审查流程（先安全后性能再风格）
输出格式（严重程度 + 代码位置 + 修复建议）
安全护栏（"不自动合并代码"）

Agent 执行：

按 Skill 清单逐项检查
自主发现 Skill 未覆盖的潜在问题
发布审查评论
受 Skill 护栏约束，不越权操作

失效模式：

Skill 软失效：AI 跳过某些检查项 → 加强措辞、添加自检
Agent 走偏：在某个文件花太多时间 → 限制每文件最大循环次数
协同失效：Agent 忽略了"不自动合并" → 护栏设在代码层（权限金字塔）

🚨场景 2：批量修复 API 错误处理⭐⭐⭐ 困难

你的项目有 50+ 个 API 端点，错误处理不统一。你希望 AI 能搜索所有端点、分析现有错误处理模式、逐个修复。

设计要求

AI 自主搜索和遍历所有 API 端点
按统一标准修复错误处理
不修改业务逻辑
修复后运行测试验证

请回答

这个场景适合只用 Skill、只用 Agent、还是 Skill + Agent 协同？
Skill 应该定义什么？Agent 应该做什么？
Agent 可能的失控类型有哪些？如何防御？

参考方案

判断：Skill + Agent 协同（模式 2：Agent 主导）

分析：任务是开放性的——50+ 个端点的错误处理模式不统一，需要 Agent 自主搜索、分析、逐个修复。但需要 Skill 定义"统一标准"和"安全约束"。

Skill 定义：

统一错误处理标准（try-catch 模式、错误码规范）
安全约束（"不修改业务逻辑"、"不改变 API 签名"）
修复后必须运行测试

Agent 执行：

搜索所有 API 端点
分析现有错误处理模式
按 Skill 标准逐个修复
修复后运行测试

Agent 失控防御：

无限循环 → 限制最大修复 50 个端点
走偏 → 每个修复后检查与目标的偏离度
越权操作 → 权限金字塔：禁止修改业务逻辑
成本爆炸 → token 止损线

🔒场景 3：合规代码审查⭐⭐⭐⭐ 专家

你的金融团队需要 AI 对每次提交的代码进行合规审查，审查标准来自监管文件，审查结果需要留痕。

设计要求

AI 按监管标准审查代码
审查结果存档，可追溯
不合规的代码自动阻止合并
审查标准随监管更新

请回答

哪些需求属于 Skill？哪些属于 Agent？
Skill 和 Agent 如何保证合规留痕？
用哪种协同模式？为什么？

参考方案

Skill：

监管审查标准（数据隐私、交易安全、审计日志...）
审查流程（逐项检查、按严重程度分类）
输出格式（合规/不合规、具体条款引用）

Agent：

按 Skill 标准自主审查代码
自主发现标准未覆盖的合规风险
存储审查结果（操作留痕）
阻止不合规代码合并

协同模式：模式 3（深度融合）

留痕策略：Agent 的行为日志完整记录每一步决策（可审计）+ Skill 的审查标准文档（合规依据）+ MCP 工具调用记录（操作留痕）

🚀场景 4：自动化部署流水线⭐⭐⭐ 困难

你的团队需要 AI 辅助部署——监控环境状态、满足条件自动部署、异常时自主判断回滚策略。

设计要求

AI 监控部署环境状态
满足条件时自动部署
异常时自主判断回滚策略
部署操作需要留痕

请回答

这个场景用 Skill 还是用 Agent？为什么？
如果用 Skill + Agent，Skill 定义什么护栏？
Agent 的失控风险有哪些？如何防御？

参考方案

判断：Skill + Agent 协同（模式 2：Agent 主导）

Skill 定义护栏：

部署禁忌（"不要在数据库迁移期间部署"、"不要跳过测试"）
操作顺序（"先测试 → 再构建 → 再部署 → 再验证"）
紧急处理规则（"回滚失败 → 通知人工"）

Agent 执行：

监控环境状态
满足条件自主部署
异常时判断回滚策略
部署操作记录留痕

失控防御：

越权操作 → 权限金字塔：部署到生产需审批
走偏 → 每步检查与部署目标的偏离度
级联失败 → 部署 Agent 和回滚 Agent 独立沙箱
成本爆炸 → 部署超时自动停止

💬场景 5：智能客户支持⭐⭐ 中等

你的客服团队每天收到 100+ 工单。你希望 AI 能自主理解问题、查询知识库、生成回复、更新工单状态。简单问题自动处理，复杂问题升级人工。

设计要求

AI 自主理解客户问题
查询知识库生成回复
简单问题自动处理，复杂问题升级人工
不说承诺退款、不透露内部信息

请回答

哪些需求属于 Skill？哪些属于 Agent？
如何保证 AI 不会说出不该说的话？
用哪种协同模式？

参考方案

Skill：

回复规范（语气、模板、常见问题）
回复禁忌（"不要承诺退款"、"不要透露内部系统信息"）
升级规则（什么情况转人工）
输出格式

Agent：

自主理解客户问题
查询知识库
生成回复
更新工单状态

防止 AI 说不该说的话：护栏设在 Agent 代码层——在发布回复前自动检查是否违反禁忌列表。不只是提示词层，因为 Agent 可能绕过提示词约束。

协同模式：模式 2（Agent 主导）+ Skill 做安全带

本节核心要点

场景 1（代码审查）：深度融合——知识和自主发现同等重要
场景 2（批量修复）：Agent 主导——操作是核心，Skill 做护栏
场景 3（合规审查）：深度融合——知识和留痕同等重要
场景 4（部署流水线）：Agent 主导——自主决策是核心，Skill 做禁忌
场景 5（客户支持）：Agent 主导——自主理解是核心，Skill 做安全带

← 上一节：概念题 | 目录 | 下一节：综合实战 →

6.2 设计题——给真实场景设计方案 ​

设计要求 ​

请回答 ​

设计要求 ​

请回答 ​

设计要求 ​

请回答 ​

设计要求 ​

请回答 ​

设计要求 ​

请回答 ​

6.2 设计题——给真实场景设计方案

设计要求

请回答

设计要求

请回答

设计要求

请回答

设计要求

请回答

设计要求

请回答