4.2 成本与性能权衡

小王的方案要上线了，他需要算清楚成本——Skill 的 token 成本可预测，Agent 的 token 成本有"决策循环"的额外开销。

成本结构对比

Skill 成本

可预测每轮对话固定消耗，容易预算

线性Skill 越长 → 每轮成本越高

低基数Level 1 仅 ~100 token/技能包

无隐性走偏成本为零——Skill 不做决策

Agent 成本

波动决策循环次数不固定，成本难预测

决策循环每步"思考→行动→观察"都消耗 token

高基数系统提示词 + 工具描述 + 历史数据

隐性走偏 1 次可能浪费 50,000+ token

Token 成本计算

以"每天审查 10 个 PR"为例：

Skill 方案

Skill 指令（输入）

5,000

PR 代码（输入）

30K

30,000

AI 输出

15K

15,000

每日总 token

~50K

~50,000

每日费用 ($3/M in, $15/M out)

~$0.34

Agent 方案

系统提示词（输入）

3,000

工具描述（输入）

2,000

PR 代码（输入）

30K

30,000

决策循环（混合）

20K

20,000

历史数据（输入）

5,000

AI 输出

15K

15,000

每日总 token

~75K

~75,000

每日费用 ($3/M in, $15/M out)

~$0.53

Skill + Agent 协同方案

Skill + 系统提示词（输入）

8,000

工具描述（输入）

2,000

PR 代码（输入）

30K

30,000

决策循环（混合）

15K

15,000

历史数据（输入）

5,000

AI 输出

15K

15,000

每日总 token

~80K

~80,000

每日费用 ($3/M in, $15/M out)

~$0.56

关键发现：

Skill 方案的 token 成本更可预测——每轮固定消耗，约 $0.34/天
Agent 方案多出"决策循环"成本——每步思考都消耗 token，约 $0.53/天
输出 token 按输出价格计费（$15/MTok），是输入价格（$3/MTok）的 5 倍——这是实际成本远高于纯 token 数量估算的原因
Agent 的隐性成本：走偏后的修复成本。Agent 走偏 1 次，可能浪费 50,000+ token（循环 10 步才发现方向错了）
Skill + Agent 协同方案：约 $0.56/天，看似比单独 Agent 更贵，但 Skill 的护栏减少了走偏概率，实际总成本可能更低

优化策略

Skill 成本优化

Progressive Disclosure▶

只注入相关的 Skill 部分，减少 30-60% token。Level 1 仅 ~100 token/技能包。

精简措辞▶

用"必须"替代"请确保你一定要"，减少冗余。每行指令都应无废话。

合并 Skill▶

多个小 Skill 合并为一个大 Skill，减少重复内容。避免同一规则在多个 Skill 中重复定义。

按需激活▶

只在相关任务时激活 Skill，不是每次都注入。利用 disable-model-invocation: true 防止自动触发。

Agent 成本优化

限制最大循环次数▶

防止无限循环，硬性设置 Agent 最多执行 N 步。超限自动停止并报告。

模型分级决策▶

简单决策用小模型（Haiku），复杂决策用大模型（Sonnet/Opus）。不是每步都需要最强模型。

缓存中间结果▶

利用记忆系统缓存查询结果，避免 Agent 重复执行相同操作。Agent 的长期记忆是天然的缓存层。

设置止损线▶

token 消耗超限自动停止，费用预警。走偏 1 次可能浪费 50K+ token，止损线是最后的防线。

性能权衡

SkillAgent

成本可预测性

高

低

固定消耗，每轮可预算决策循环次数不固定

适应性

低

高

只覆盖预定义场景能应对未预见的情况

可预测性

高

低

确定性规则，输出稳定非确定性决策，路径不同

隐性成本

高

无（Skill 不做决策）走偏恢复成本高

本节核心要点

Skill 成本可预测（每轮固定消耗），Agent 成本有波动（决策循环次数不固定）
输出 token 按输出价格计费（$15/MTok），远高于输入价格（$3/MTok），实际成本是纯 token 数量估算的 2-3 倍
Agent 多出"决策循环"成本——每步思考都消耗 token
Agent 的隐性成本：走偏后的修复成本，1 次走偏可能浪费 50,000+ token
Skill + Agent 协同：成本略高于单独 Agent，但护栏减少走偏，实际总成本可能更低
Skill 优化：渐进披露、精简措辞、合并、按需激活
Agent 优化：限制循环次数、模型分级、缓存中间结果、设置止损线

← 上一节：失效模式——软失效 vs 失控 | 目录 | 下一节：企业落地策略 →

4.2 成本与性能权衡 ​

成本结构对比 ​

Token 成本计算 ​

优化策略 ​

Skill 成本优化 ​

Agent 成本优化 ​

性能权衡 ​

4.2 成本与性能权衡

成本结构对比

Token 成本计算

优化策略

Skill 成本优化

Agent 成本优化

性能权衡