Skip to content

1.1 操作手册还是实习生?

小王已经写了一堆 Skill,AI 遵循得很好。但他遇到复杂任务时,Skill 不够用了——他需要知道什么时候该让 AI 自己判断。


什么是 Skill?

Skill 是 AI 工具的可复用能力单元,本质上是一份结构化的指令文件,在合适的时机被注入到 AI 的上下文中,让 AI"知道怎么做"。

一次定义,反复使用:把重复的指令写成配置文件,避免每次对话都重新解释
按需注入:AI 在合适时机自动加载或用户通过命令触发
被动知识:Skill 本身不执行、不决策,它只是告诉 AI"遇到这类任务时该怎么做"

什么是 Agent?

Agent 是能自主感知、规划、行动的 AI 系统。它不再是被动地回答问题,而是给定目标后自己决定"怎么做"。

Agent 核心公式
Agent = 自主决策 + 工具使用 + 循环执行 + 目标追踪

Agent 的四层核心组件:

层级组件作用
L1系统提示词定义角色、能力和行为边界——"你是谁、该做什么、不能做什么"
L2工具与外部世界交互的能力——读文件、跑命令、调 API
L2记忆保持上下文连贯性——工作记忆、短期记忆、长期记忆、用户记忆
核心决策循环思考 → 行动 → 观察 → 反思 → 再思考,直到任务完成

核心类比:操作手册 vs 实习生

操作手册
告诉 AI:先检查什么、后检查什么、发现问题怎么记录、报告怎么写。

操作手册不会自己翻页——你翻到哪一页,它就告诉你那一页的内容。
= Skill(被动参照)
实习生
给一个目标:"把这批 PR 的安全问题都找出来"——实习生自己拆解任务、查资料、写报告、遇到意外自己调整。

实习生会自己决定下一步做什么。
= Agent(自主决策)

关键区别:决策循环

Skill 和 Agent 的根本区别不在于"能做什么",而在于有没有决策循环

Skill 运行流程
注入上下文AI 参照执行输出结果

模式:输入 → 输出,一步完成
没有循环,没有"下一步该做什么"的判断
Agent 运行流程
接收目标思考行动观察反思再思考

模式:循环往复直到目标完成
决策循环是 Agent 的核心突破

举例:Skill 写了"检查 SQL 注入",AI 就检查 SQL 注入。但如果代码用的是 ORM 而非原始 SQL,Skill 没写"检查 ORM 注入",AI 就跳过了。Agent 会自己发现"这是 ORM"并调整检查策略。


Skill 在各工具中的实现

工具实现方式文件结构触发方式
Claude CodeSkills 目录.claude/skills/name/SKILL.md/name 命令或自动发现
CursorCustom Commands设置 → Commands快捷键或手动调用
WindsurfCascade Rules.windsurfrules 内规则块Cascade 自动匹配
ClineCustom Instructions.clinerules自动或手动

渐进式披露:手电筒 vs 长明灯

Skill 的哲学根基是渐进式披露(Progressive Disclosure)——来自人机交互领域的经典原则:不是"给更多信息",而是"在正确的时间展示正确的信息"。

长明灯(项目指令文件)
CLAUDE.md 等项目指令文件是"始终开着的灯"——照亮一切但也浪费电。所有内容一直占着上下文。
30 个指令全量加载 = 90,000 token
手电筒(Skill 技能包)
技能包是"按需打开的手电筒"——需要时照亮,不需要时零消耗。只注入当前任务相关的知识。
30 个技能包 Level 1 = 3,000 token,节省 97%

本节核心要点

  • Skill = 可复用的结构化指令文件,被动注入,告诉 AI"怎么做"——像操作手册
  • Agent = 自主感知、规划、行动的 AI 系统,主动决策,自己决定"怎么做"——像实习生
  • 两者根本区别:Skill 没有决策循环,Agent 的突破就是决策循环
  • Skill 的哲学是渐进式披露——手电筒比长明灯更省电

思考题:你当前的工作中,哪些任务是在"翻操作手册"(Skill 就够了),哪些任务需要"派一个实习生"(需要 Agent)?


← 课程首页 | 目录 | 下一节:从 Chat 到 Agent 的自主性光谱 →