1.2 从 Chat 到 Agent 的自主性光谱
小王发现"用 Skill 还是用 Agent"不是二选一——他需要理解自主性是一个光谱。
自主性不是二选一
AI 系统的自主性不是"有"或"无"的二选一,而是一个从完全被动到完全自主的光谱。
被动响应建议级半自动自主高度自主完全自主
Skill 区域 (L0-L2)
Agent 区域 (L3-L5)
六级自主性模型
| Level | 名称 | 描述 | 典型代表 | 人类角色 |
|---|---|---|---|---|
| 0 | 被动响应 | AI 只回答问题,不主动建议 | ChatGPT 基础问答 | 完全主导 |
| 1 | 建议级 | AI 提供建议,人类决定是否采纳 | Skill 注入、Custom Instructions | 决策者 |
| 2 | 半自动 | AI 执行单步操作,人类确认后继续 | Copilot 补全、Skill + allowed-tools | 审批者 |
| 3 | 自主 | AI 自主完成多步任务,关键节点暂停 | Claude Code、Cursor Agent | 监督者 |
| 4 | 高度自主 | AI 自主规划执行,人类只在异常时介入 | 自动化 Agent、CI/CD Agent | 旁观者 |
| 5 | 完全自主 | AI 独立运行,人类不参与 | 全自动交易系统、自动驾驶 | 事后审计 |
L0被动响应——AI 只回答问题,不主动建议。你问一句,它答一句。人类完全主导。
L1建议级——Skill 注入就是这个级别。AI 参照你的指令提供标准化建议,但不会自己行动。人类是决策者。
L2半自动——Skill + `allowed-tools` 到这里。AI 可以执行单步操作,但每一步都需要人类确认。人类是审批者。
L3自主——Agent 从这里开始。AI 自主完成多步任务,关键节点暂停请示。人类是监督者。
L4高度自主——AI 自主规划并执行,人类只在异常时介入。CI/CD Agent 就在这个级别。人类是旁观者。
L5完全自主——AI 独立运行,人类不参与。全自动交易系统、自动驾驶。人类只能事后审计。
关键洞察:自主性越高,能力越强,但风险也越大
关键洞察
选型的核心不是"越高越好",而是"在合适的场景给合适的自主性"。
2023 年 AutoGPT 的失败教训让行业意识到——完全自主的 Agent 会无限循环、走偏、成本爆炸。2025 年后的趋势是"可控自主"而非"完全自主"。
2023 年 AutoGPT 的失败教训让行业意识到——完全自主的 Agent 会无限循环、走偏、成本爆炸。2025 年后的趋势是"可控自主"而非"完全自主"。
从 Prompt 到 Agent 的递进关系
Skill 和 Agent 不是并列的替代关系,而是递进关系——每一层都建立在前一层的基础上:
1
Prompt(提示词)一次性
"怎么跟 AI 说话"
一次性、临时性、不可复用。每次都要重新解释你想让 AI 怎么做。
2
Skill(技能包)可复用
"怎么把好的 Prompt 复用起来"
可复用、按需注入、渐进式披露。Skill = 可复用的 Prompt 体系——把散落的最佳实践变成结构化的指令文件。
3
Agent(AI 代理)自主决策
"怎么让 AI 自己干复杂任务"
自主决策、循环执行、工具编排。Agent = 带决策循环和工具的 Skill——Skill 告诉 AI"怎么做",Agent 让 AI"自己决定怎么做"。
4
Multi-Agent(多代理系统)协作网络
"怎么让多个 AI 协作完成更大的目标"
分工协作、层级指挥、并行执行。Multi-Agent = 多个 Agent 的协作网络——单个 Agent 能力有限,多 Agent 协作能完成更复杂的任务。
小王的理解
小王现在明白了:Skill 和 Agent 不是"选 A 还是选 B",而是"你在自主性光谱的哪个位置"。
- 任务简单、步骤可预定义 → Skill(L1-L2)就够了
- 任务复杂、需要 AI 自己判断 → Agent(L3-L5)才合适
- 大部分真实场景 → 两者结合,Skill 给知识,Agent 给决策
本节核心要点
- 自主性是一个光谱,不是二选一:从 L0(被动响应)到 L5(完全自主)
- Skill 位于 L0-L2(建议、半自动),Agent 位于 L3-L5(自主、高度自主、完全自主)
- 从 Prompt → Skill → Agent → Multi-Agent 是递进关系:Skill = 可复用 Prompt 体系,Agent = 带决策循环和工具的 Skill
- 自主性越高能力越强,但风险也越大——选型的核心是"在合适场景给合适自主性"
思考题:你目前用 AI 的方式,在自主性光谱的哪个级别?你有没有在 L1 就够用的场景里用了 L3 的方案(或反过来)?