Skip to content

2.3 技术架构一图看懂

小王理解了七个区别,现在想从架构角度整体把握两者技术全貌。


Skill 的技术架构

Skill 技术架构
  • .claude/skills/name/(技能目录)
  • SKILL.md ← 主指令文件(必需)
    Frontmatter ← 元数据:名称、触发条件、工具预授权
    • name / description — 发现层(~100 token)
      when_to_use — 激活条件
      allowed-tools — 预授权工具
      disable-model-invocation — 禁止自动触发
      context: fork — 隔离执行
    Instructions ← 激活层(<5000 token)
    references/ ← 资源层(按需,无限制)
    scripts/ ← 可执行脚本
    examples/ ← 输出示例
Level 1: 发现Level 2: 激活Level 3: 资源
渐进式披露:30 个 Skill 全量加载 90,000 token → Level 1 仅 3,000 token,节省 97%
渐进式披露按需注入动态预处理 !`cmd`context: forkallowed-tools

动态上下文注入!`command` 语法在 AI 看到内容之前预处理执行,将结果嵌入。例如 !`git diff HEAD` 让 AI 直接看到真实的 diff 数据——Skill 不存储状态,但能注入实时信息。


Agent 的技术架构

Agent 技术架构
  • 四大核心组件
  • L1: 系统提示词 ← "你是谁、该做什么、不能做什么"
    L2: 工具 ← 读写文件、跑命令、调 API
    L2: 记忆 ← 四层架构
    • L1 工作记忆 — 当前任务中间结果(上下文窗口)
      L2 短期记忆 — 交互历史(对话历史)
      L3 长期记忆 — 跨会话知识(向量数据库)
      L4 用户记忆 — 用户偏好(永久)
    核心: 决策循环 ← 思考→行动→观察→反思→再思考
思考行动观察反思再思考
决策循环是 Agent 与 Skill 的根本区别——Chat 是"输入→输出"一步完成,Agent 是循环往复直到完成
ReActPlan-ExecuteReflexionMulti-AgentHierarchical

五种决策模式

模式核心思想适用场景
ReAct边想边干——思考→行动→观察循环信息查询、简单操作
Plan-Execute先想后干——先规划再执行多步骤结构化任务
Reflexion干了再反思——执行→反思→改进高质量输出
Multi-Agent团队协作——多 Agent 分工多专业领域、可并行
Hierarchical层级指挥——管理者指挥工作者复杂项目需统一协调

Claude Code Skills vs Agent SDK

两者是不同层面的东西——Skills 是"给现有 AI 工具装能力",Agent SDK 是"从零构建新的 AI Agent"。

维度Claude Code SkillsAnthropic Agent SDK
定位给现有 AI 工具装能力从零构建新的 AI Agent
面向开发者日常编程工作流需要构建自定义 AI 系统的开发者
定义方式SKILL.md 文件Python API
运行位置Claude Code 内部独立进程
决策权无——Skill 不做决策有——Agent 自主决策
工具调用allowed-tools 预授权,间接指引直接调用,Agent 自主编排
状态管理无状态(文件)有状态(Python 运行时)
多 Agentcontext: fork 子代理原生 Multi-Agent 支持
MCP 集成通过 Claude Code 间接使用直接集成,原生支持
学习曲线低(写 Markdown)中(写 Python)
部署复杂度低(放文件到项目)中(需要部署和运行)

两者如何衔接

Skill 和 Agent 在 AI 应用中是这样衔接的:

Skill 知识层
告诉 AI:
• 审查标准是什么
• 部署禁忌是什么
• 输出格式是什么
• 流程顺序是什么
指导 + 护栏
Agent 决策层
让 AI 自己决定:
• 下一步该做什么
• 用什么工具
• 结果是否达标
• 遇到意外怎么调整

Skill 告诉 AI "做什么"(知识和标准),Agent 让 AI "自己决定怎么做"(决策和执行)。


架构核心差异

载体Markdown 文件(静态)
载体Python API + 运行时(动态)
部署方式放文件到项目(零运维)
部署方式部署和运行进程(需运维)
扩展方式加内容(但 token 成本上升)
扩展方式加工具/Agent(不增加 AI 上下文)
上下文管理精细——渐进式披露三层
上下文管理粗放——四层记忆但较重
子代理context: fork 隔离执行
多代理原生 Multi-Agent 支持

本节核心要点

  • Skill 架构:Markdown 文件 → 三级渐进式披露 → 注入上下文 → AI 遵循
  • Agent 架构:四大组件(提示词+工具+记忆+决策循环) → 循环执行 → 自主完成
  • Claude Code Skills vs Agent SDK:Skills 是"装能力",Agent SDK 是"造 Agent"
  • 两者衔接:Skill 提供知识和护栏,Agent 做决策和执行

思考题:你的项目中,Skill 的"渐进式披露"和 Agent 的"四层记忆"分别解决了什么问题?什么时候需要两者结合?


← 上一节:七个本质区别 | 目录 | 下一节:只用 Skill 的体验 →