Skip to content

4.2 成本与性能权衡

小王的方案要上线了,他需要算清楚成本——Skill 的 token 成本可预测,Agent 的 token 成本有"决策循环"的额外开销。


成本结构对比

Skill 成本
可预测每轮对话固定消耗,容易预算
线性Skill 越长 → 每轮成本越高
低基数Level 1 仅 ~100 token/技能包
无隐性走偏成本为零——Skill 不做决策
Agent 成本
波动决策循环次数不固定,成本难预测
决策循环每步"思考→行动→观察"都消耗 token
高基数系统提示词 + 工具描述 + 历史数据
隐性走偏 1 次可能浪费 50,000+ token

Token 成本计算

以"每天审查 10 个 PR"为例:

Skill 方案
Skill 指令(输入)
5K
5,000
PR 代码(输入)
30K
30,000
AI 输出
15K
15,000
每日总 token
~50K
~50,000
每日费用 ($3/M in, $15/M out)
~$0.34
~$0.34
Agent 方案
系统提示词(输入)
3K
3,000
工具描述(输入)
2K
2,000
PR 代码(输入)
30K
30,000
决策循环(混合)
20K
20,000
历史数据(输入)
5K
5,000
AI 输出
15K
15,000
每日总 token
~75K
~75,000
每日费用 ($3/M in, $15/M out)
~$0.53
~$0.53
Skill + Agent 协同方案
Skill + 系统提示词(输入)
8K
8,000
工具描述(输入)
2K
2,000
PR 代码(输入)
30K
30,000
决策循环(混合)
15K
15,000
历史数据(输入)
5K
5,000
AI 输出
15K
15,000
每日总 token
~80K
~80,000
每日费用 ($3/M in, $15/M out)
~$0.56
~$0.56

关键发现

  • Skill 方案的 token 成本更可预测——每轮固定消耗,约 $0.34/天
  • Agent 方案多出"决策循环"成本——每步思考都消耗 token,约 $0.53/天
  • 输出 token 按输出价格计费($15/MTok),是输入价格($3/MTok)的 5 倍——这是实际成本远高于纯 token 数量估算的原因
  • Agent 的隐性成本:走偏后的修复成本。Agent 走偏 1 次,可能浪费 50,000+ token(循环 10 步才发现方向错了)
  • Skill + Agent 协同方案:约 $0.56/天,看似比单独 Agent 更贵,但 Skill 的护栏减少了走偏概率,实际总成本可能更低

优化策略

Skill 成本优化

Progressive Disclosure
只注入相关的 Skill 部分,减少 30-60% token。Level 1 仅 ~100 token/技能包。
精简措辞
用"必须"替代"请确保你一定要",减少冗余。每行指令都应无废话。
合并 Skill
多个小 Skill 合并为一个大 Skill,减少重复内容。避免同一规则在多个 Skill 中重复定义。
按需激活
只在相关任务时激活 Skill,不是每次都注入。利用 disable-model-invocation: true 防止自动触发。

Agent 成本优化

限制最大循环次数
防止无限循环,硬性设置 Agent 最多执行 N 步。超限自动停止并报告。
模型分级决策
简单决策用小模型(Haiku),复杂决策用大模型(Sonnet/Opus)。不是每步都需要最强模型。
缓存中间结果
利用记忆系统缓存查询结果,避免 Agent 重复执行相同操作。Agent 的长期记忆是天然的缓存层。
设置止损线
token 消耗超限自动停止,费用预警。走偏 1 次可能浪费 50K+ token,止损线是最后的防线。

性能权衡

SkillAgent
成本可预测性
固定消耗,每轮可预算决策循环次数不固定
适应性
只覆盖预定义场景能应对未预见的情况
可预测性
确定性规则,输出稳定非确定性决策,路径不同
隐性成本
无(Skill 不做决策)走偏恢复成本高

本节核心要点

  • Skill 成本可预测(每轮固定消耗),Agent 成本有波动(决策循环次数不固定)
  • 输出 token 按输出价格计费($15/MTok),远高于输入价格($3/MTok),实际成本是纯 token 数量估算的 2-3 倍
  • Agent 多出"决策循环"成本——每步思考都消耗 token
  • Agent 的隐性成本:走偏后的修复成本,1 次走偏可能浪费 50,000+ token
  • Skill + Agent 协同:成本略高于单独 Agent,但护栏减少走偏,实际总成本可能更低
  • Skill 优化:渐进披露、精简措辞、合并、按需激活
  • Agent 优化:限制循环次数、模型分级、缓存中间结果、设置止损线

← 上一节:失效模式——软失效 vs 失控 | 目录 | 下一节:企业落地策略 →