Skip to content

1.1 从聊天到行动——小李的 AI 助手进化之路

小李是一个全栈开发者,每天和代码、文档、Bug 打交道。他和 AI 的关系,经历了三个阶段。


阶段一:AI 是顾问

2024 年初,小李开始用 ChatGPT 写代码。模式很简单:

小李:帮我写一个 JWT 验证的中间件。

AI:好的,这是代码……

小李:帮我解释一下这段代码。

AI:这段代码的作用是……

一问一答,AI 像一个知识渊博的顾问。你问什么,它答什么。不问,它就不动。

这个阶段,小李的 AI 是 Level 0——被动响应。它没有目标,没有主动性,更不会自己去查项目、找文件、跑测试。


阶段二:AI 是助手

2024 年中,小李换上了 Cursor。他发现 AI 变了——

小李:帮我修一下登录页的 Bug,用户点登录没反应。

AI:(读取 login.tsx)我发现按钮的 onClick 没有绑定 handleSubmit。要修改吗?

小李:改吧。

AI:(修改文件)已修复。要跑一下测试吗?

AI 有了工具——能读文件、改代码、跑命令。但每一步都要小李确认。它像一个听话的助手:你指哪它打哪,但不指就不动。

这是 Level 2——半自主。AI 可以自己读文件和分析,但涉及修改和执行,它必须等你点头。


阶段三:AI 是实习生

2025 年,小李开始用 Claude Code。某天他输入了:

小李:项目里所有 API 端点都没有错误处理,帮我加上。

AI:(搜索所有 API 路由文件)发现 12 个端点文件。我先分析每个端点的错误类型,然后逐个添加 try-catch 和统一错误响应格式。开始执行……

AI:(读取文件 1 → 分析 → 修改 → 读取文件 2 → 分析 → 修改 → ……)已完成 12 个端点的错误处理,新增了统一的 errorHandler.ts。要跑一下测试吗?

AI 不再只是一问一答,它有了目标,有了计划,有了循环执行的能力。它像一个实习生:你给一个任务,它自己拆解、自己执行、自己检查,完成后汇报结果。

这是 Level 3-4——自主执行


三个阶段的本质区别

1顾问Level 0
💬 问一句,答一句
❌ 没有工具,没有记忆,没有主动性
2助手Level 1-2
🛠️ 有工具,需确认
⚡ 你指哪,它打哪;不指就不动
3实习生Level 3-5
🎯 有目标,能执行
✅ 自己拆解、自己检查、自己汇报 Agent

从 Chat 到 Agent,不是「变得更聪明」,而是获得了三种新能力

能力ChatAgent
工具使用无,只能生成文本能读文件、跑命令、调 API
循环执行单次问答,不迭代思考→行动→观察→再思考,直到完成
目标追踪没有目标概念知道「任务是什么」「完成没有」

核心公式

Agent = 自主决策 + 工具使用 + 循环执行 + 目标追踪


那为什么不是所有 AI 都是 Agent?

小李想:既然 Agent 这么强,为什么 AI 不直接都变成 Agent?

答案很简单:自主性是有代价的

  • Agent 每一步都在消耗 Token,一个复杂任务可能花掉 10 美元
  • Agent 可能走偏——你让它修 Bug,它把整个模块重写了
  • Agent 可能陷入死循环——不断尝试、不断失败、不断重试

所以,Agent 不是万能的。简单问答用 Chat,复杂任务用 Agent,关键在于判断——什么时候该让 AI 自己干,什么时候该你亲自把关。

这个问题,我们在 1.3 你需要 Agent 吗? 会详细讨论。但在此之前,让我们先看看历史——2023 年那场「AI 自主化」的狂热,以及它留下的教训。


本节核心要点

  • Chat 是一问一答的顾问,Agent 是能自主执行的实习生
  • Agent 的三种核心能力:工具使用、循环执行、目标追踪
  • 自主性从 Level 0 到 Level 5,不是越高越好
  • Agent 有代价:Token 消耗、走偏风险、死循环可能

思考题:回想你最近一次使用 AI 编程工具的场景,它是在哪个层级?有没有哪些任务你希望它更自主,但又不敢放手?


下一节预告:2023 年,AutoGPT 让全世界以为 AI Agent 的时代已经到来。但狂热过后,留下了什么教训?

下一节:AutoGPT 的教训 →