Skip to content

3.4 框架四:分步思考

引言:一句话改变 AI 的"智商"

2022 年,Google 研究员 Jason Wei 发现了一个神奇的技巧。

他让 AI 解数学题,AI 经常出错。

然后,他加了一句话:

Let's think step by step.
(让我们一步步思考)

奇迹发生了——AI 的准确率飙升 50%!

这个发现震惊了学术界。一个句子,就能改变 AI 的「智商」?

这就是 「思维链」(Chain of Thought) 的诞生故事。今天,这个技巧已成为 Prompt 工程的核心武器。


动画演示:CoT 效果对比

❌ 无 CoT(直接回答)✅ 有 CoT(分步思考)
小明有 15 个苹果,给了小红 3 个,又买了 7 个,吃掉一半。现在有几个?
小明有 15 个苹果,给了小红 3 个,又买了 7 个,吃掉一半。现在有几个?

分步思考让准确率从 50% 提升到 95%

提升 45%!一句话改变 AI 的"智商"


一个直观对比

无 CoT(直接回答)

问题:小明有 15 个苹果,给了小红 3 个,又买了 7 个,吃掉一半。现在有几个?

AI 直接回答:10 个

                    可能算错!

有 CoT(分步思考)

问题:小明有 15 个苹果,给了小红 3 个,又买了 7 个,吃掉一半。现在有几个?

请一步步思考:

步骤 1:小明原本有 15 个苹果
步骤 2:给了小红 3 个 → 剩下 15 - 3 = 12 个
步骤 3:又买了 7 个 → 变成 12 + 7 = 19 个
步骤 4:吃掉一半 → 剩下 19 ÷ 2 = 9.5 个
步骤 5:答案是 9.5(或 9-10,取决于怎么理解)

AI 输出:9.5 个

                    计算清晰,更准确!

效果对比

❌ 无 CoT(直觉模式)

  • 流程:问题 ──────► 答案
  • 方式:直接跳到答案,可能出错
  • 准确率:约 50-60%
  • → 适合简单问题,复杂问题容易出错

✅ 有 CoT(推理模式)

  • 流程:问题 ──► 步骤1 ──► 步骤2 ──► 步骤3 ──► 答案
  • 方式:展示推理过程,逐步验证
  • 准确率:约 90-95%
  • → 准确率提升 30-50%

框架定义

简单版触发语

「请一步步思考」
「Let's think step by step」
「请先分析,再给出结论」

完整版框架

请一步一步地思考以下问题:
【你的问题】

要求:
1. 先分析问题的关键点
2. 然后列出解题步骤
3. 最后给出答案

核心思想

让 AI「说出思考过程」,答案的准确率会显著提高。


为什么分步思考有效?

AI 的两种"思考模式"

🐇 模式一:直觉模式(System 1)

  • 特点:快速、自动、不费脑力
  • 适用:简单问题、常见问题
  • 问题:复杂问题容易出错
  • 示例"1+1=?" ──► 直接回答 "2"

🐢 模式二:推理模式(System 2)

  • 特点:慢速、需要努力、逐步推理
  • 适用:复杂问题、需要验证的问题
  • 优势:准确率高、可以发现错误
  • 示例"15-3+7÷2=?" ──► 步骤1: 15-3=12 ──► 步骤2: 12+7=19 ──► 步骤3: 19÷2=9.5

CoT = 强制 AI 进入推理模式

研究数据

研究表明,分步思考(Chain of Thought)可以:

任务类型准确率提升
数学问题+30-50%
逻辑推理+20-40%
复杂分析+15-25%

实战示例

示例一:数学计算

问题:小明有 23 个苹果,给了小红 5 个,又买了 12 个。请问现在有几个?

请一步步思考:
1. 小明原本有多少苹果? → 23 个
2. 给了小红后剩下多少? → 23 - 5 = 18 个
3. 又买了之后有多少? → 18 + 12 = 30 个
4. 最终答案是多少? → 30 个

示例二:逻辑推理

问题:如果下雨,小明会带伞。今天小明带了伞。请问今天是否下雨?

请一步步思考:
1. 原命题是什么?
   → 「下雨 → 带伞」(下雨则带伞)

2. 已知事实是什么?
   → 「小明带了伞」

3. 原命题能推导出什么?
   → 下雨的人会带伞,但带伞的人不一定下雨
   → 逆向推导不成立

4. 结论是什么?
   → 无法确定是否下雨
   → 可能下雨,也可能小明习惯带伞

答案:不确定,需要更多信息

示例三:复杂分析

任务:分析特斯拉的投资价值

请分步骤分析:

步骤 1:分析财务状况
├── 营收:近三年增长趋势
├── 利润:盈利能力变化
└── 增长率:是否持续增长

步骤 2:分析行业地位
├── 市场份额:电动车占比
├── 竞争对手:主要竞品对比
└── 技术优势:核心竞争力

步骤 3:分析风险因素
├── 政策风险:补贴变化
├── 技术风险:电池技术迭代
└── 市场风险:需求波动

步骤 4:综合评估
└── 结合以上分析,给出综合判断

步骤 5:给出投资建议
└── 基于综合评估的具体建议

适用场景

✓✓✓ 非常适合

  • 数学计算
  • 逻辑推理
  • 复杂分析

✓✓ 适合

  • 多步骤任务
  • 需要验证的问题

△ 可能没必要

  • 简单问答(会变慢)
  • 常见问题

✗ 不适合

  • 创意写作(打断创意流)
  • 情感表达
  • 需要直觉的任务

本节小结

📌 本节核心要点

  • 发现故事 — Jason Wei 2022 年发现 CoT,一句话提升 50% 准确率
  • 框架公式 — 分步骤思考 + 问题
  • 核心思想 — 让 AI 展示推理过程,强制进入"推理模式"
  • 触发语 — "请一步步思考" / "Let's think step by step"
  • 适用场景 — 数学、逻辑、复杂分析
  • 效果提升 — 30-50%

练习

用「分步思考」框架,为以下问题写 Prompt:

  1. 计算:3 个人分 10 个苹果,每人至少 2 个,有几种分配方式?
  2. 推理:「所有猫都会飞,Garfield 是猫,所以 Garfield 会飞」这个推理有什么问题?
  3. 分析:为什么某公司的股价最近下跌?

阶段总结:四种框架对比

框架公式适用场景
角色-任务-要求角色 + 任务 + 要求通用场景
背景-任务-格式背景 + 任务 + 格式工作场景
示例模仿示例 + 你的任务翻译、风格模仿
分步思考步骤 + 问题数学、逻辑、分析

下一阶段预告

掌握了四种框架,下一阶段我们进入实战改造——看「烂 Prompt」如何变成「好 Prompt」。

下一阶段:实战改造