Skip to content

1.2 从 Chat 到 Agent 的自主性光谱

小王发现"用 Skill 还是用 Agent"不是二选一——他需要理解自主性是一个光谱。


自主性不是二选一

AI 系统的自主性不是"有"或"无"的二选一,而是一个从完全被动到完全自主的光谱

L0
L1
L2
L3
L4
L5
被动响应建议级半自动自主高度自主完全自主
Skill 区域 (L0-L2)
Agent 区域 (L3-L5)

六级自主性模型

Level名称描述典型代表人类角色
0被动响应AI 只回答问题,不主动建议ChatGPT 基础问答完全主导
1建议级AI 提供建议,人类决定是否采纳Skill 注入、Custom Instructions决策者
2半自动AI 执行单步操作,人类确认后继续Copilot 补全、Skill + allowed-tools审批者
3自主AI 自主完成多步任务,关键节点暂停Claude Code、Cursor Agent监督者
4高度自主AI 自主规划执行,人类只在异常时介入自动化 Agent、CI/CD Agent旁观者
5完全自主AI 独立运行,人类不参与全自动交易系统、自动驾驶事后审计
L0被动响应——AI 只回答问题,不主动建议。你问一句,它答一句。人类完全主导。
L1建议级——Skill 注入就是这个级别。AI 参照你的指令提供标准化建议,但不会自己行动。人类是决策者。
L2半自动——Skill + `allowed-tools` 到这里。AI 可以执行单步操作,但每一步都需要人类确认。人类是审批者。
L3自主——Agent 从这里开始。AI 自主完成多步任务,关键节点暂停请示。人类是监督者。
L4高度自主——AI 自主规划并执行,人类只在异常时介入。CI/CD Agent 就在这个级别。人类是旁观者。
L5完全自主——AI 独立运行,人类不参与。全自动交易系统、自动驾驶。人类只能事后审计。

关键洞察:自主性越高,能力越强,但风险也越大

关键洞察
选型的核心不是"越高越好",而是"在合适的场景给合适的自主性"

2023 年 AutoGPT 的失败教训让行业意识到——完全自主的 Agent 会无限循环、走偏、成本爆炸。2025 年后的趋势是"可控自主"而非"完全自主"。

从 Prompt 到 Agent 的递进关系

Skill 和 Agent 不是并列的替代关系,而是递进关系——每一层都建立在前一层的基础上:

1
Prompt(提示词)一次性
"怎么跟 AI 说话"
一次性、临时性、不可复用。每次都要重新解释你想让 AI 怎么做。
2
Skill(技能包)可复用
"怎么把好的 Prompt 复用起来"
可复用、按需注入、渐进式披露。Skill = 可复用的 Prompt 体系——把散落的最佳实践变成结构化的指令文件。
3
Agent(AI 代理)自主决策
"怎么让 AI 自己干复杂任务"
自主决策、循环执行、工具编排。Agent = 带决策循环和工具的 Skill——Skill 告诉 AI"怎么做",Agent 让 AI"自己决定怎么做"。
4
Multi-Agent(多代理系统)协作网络
"怎么让多个 AI 协作完成更大的目标"
分工协作、层级指挥、并行执行。Multi-Agent = 多个 Agent 的协作网络——单个 Agent 能力有限,多 Agent 协作能完成更复杂的任务。

小王的理解

小王现在明白了:Skill 和 Agent 不是"选 A 还是选 B",而是"你在自主性光谱的哪个位置"。

  • 任务简单、步骤可预定义 → Skill(L1-L2)就够了
  • 任务复杂、需要 AI 自己判断 → Agent(L3-L5)才合适
  • 大部分真实场景 → 两者结合,Skill 给知识,Agent 给决策

本节核心要点

  • 自主性是一个光谱,不是二选一:从 L0(被动响应)到 L5(完全自主)
  • Skill 位于 L0-L2(建议、半自动),Agent 位于 L3-L5(自主、高度自主、完全自主)
  • 从 Prompt → Skill → Agent → Multi-Agent 是递进关系:Skill = 可复用 Prompt 体系,Agent = 带决策循环和工具的 Skill
  • 自主性越高能力越强,但风险也越大——选型的核心是"在合适场景给合适自主性"

思考题:你目前用 AI 的方式,在自主性光谱的哪个级别?你有没有在 L1 就够用的场景里用了 L3 的方案(或反过来)?


← 上一节:操作手册还是实习生 | 目录 | 下一节:决策指南——三问法 →