4.2 成本与性能权衡
小王的方案要上线了,他需要算清楚成本——Skill 的 token 成本可预测,Agent 的 token 成本有"决策循环"的额外开销。
成本结构对比
Skill 成本
可预测每轮对话固定消耗,容易预算
线性Skill 越长 → 每轮成本越高
低基数Level 1 仅 ~100 token/技能包
无隐性走偏成本为零——Skill 不做决策
Agent 成本
波动决策循环次数不固定,成本难预测
决策循环每步"思考→行动→观察"都消耗 token
高基数系统提示词 + 工具描述 + 历史数据
隐性走偏 1 次可能浪费 50,000+ token
Token 成本计算
以"每天审查 10 个 PR"为例:
Skill 方案
Skill 指令(输入)5,000
PR 代码(输入)30,000
AI 输出15,000
每日总 token~50,000
每日费用 ($3/M in, $15/M out)~$0.34
Agent 方案
系统提示词(输入)3,000
工具描述(输入)2,000
PR 代码(输入)30,000
决策循环(混合)20,000
历史数据(输入)5,000
AI 输出15,000
每日总 token~75,000
每日费用 ($3/M in, $15/M out)~$0.53
Skill + Agent 协同方案
Skill + 系统提示词(输入)8,000
工具描述(输入)2,000
PR 代码(输入)30,000
决策循环(混合)15,000
历史数据(输入)5,000
AI 输出15,000
每日总 token~80,000
每日费用 ($3/M in, $15/M out)~$0.56
关键发现:
- Skill 方案的 token 成本更可预测——每轮固定消耗,约 $0.34/天
- Agent 方案多出"决策循环"成本——每步思考都消耗 token,约 $0.53/天
- 输出 token 按输出价格计费($15/MTok),是输入价格($3/MTok)的 5 倍——这是实际成本远高于纯 token 数量估算的原因
- Agent 的隐性成本:走偏后的修复成本。Agent 走偏 1 次,可能浪费 50,000+ token(循环 10 步才发现方向错了)
- Skill + Agent 协同方案:约 $0.56/天,看似比单独 Agent 更贵,但 Skill 的护栏减少了走偏概率,实际总成本可能更低
优化策略
Skill 成本优化
Agent 成本优化
性能权衡
SkillAgent
成本可预测性
固定消耗,每轮可预算决策循环次数不固定
适应性
只覆盖预定义场景能应对未预见的情况
可预测性
确定性规则,输出稳定非确定性决策,路径不同
隐性成本
无(Skill 不做决策)走偏恢复成本高
本节核心要点
- Skill 成本可预测(每轮固定消耗),Agent 成本有波动(决策循环次数不固定)
- 输出 token 按输出价格计费($15/MTok),远高于输入价格($3/MTok),实际成本是纯 token 数量估算的 2-3 倍
- Agent 多出"决策循环"成本——每步思考都消耗 token
- Agent 的隐性成本:走偏后的修复成本,1 次走偏可能浪费 50,000+ token
- Skill + Agent 协同:成本略高于单独 Agent,但护栏减少走偏,实际总成本可能更低
- Skill 优化:渐进披露、精简措辞、合并、按需激活
- Agent 优化:限制循环次数、模型分级、缓存中间结果、设置止损线