1.1 从聊天到行动——小李的 AI 助手进化之路
小李是一个全栈开发者,每天和代码、文档、Bug 打交道。他和 AI 的关系,经历了三个阶段。
阶段一:AI 是顾问
2024 年初,小李开始用 ChatGPT 写代码。模式很简单:
小李:帮我写一个 JWT 验证的中间件。
AI:好的,这是代码……
小李:帮我解释一下这段代码。
AI:这段代码的作用是……
一问一答,AI 像一个知识渊博的顾问。你问什么,它答什么。不问,它就不动。
这个阶段,小李的 AI 是 Level 0——被动响应。它没有目标,没有主动性,更不会自己去查项目、找文件、跑测试。
阶段二:AI 是助手
2024 年中,小李换上了 Cursor。他发现 AI 变了——
小李:帮我修一下登录页的 Bug,用户点登录没反应。
AI:(读取 login.tsx)我发现按钮的 onClick 没有绑定 handleSubmit。要修改吗?
小李:改吧。
AI:(修改文件)已修复。要跑一下测试吗?
AI 有了工具——能读文件、改代码、跑命令。但每一步都要小李确认。它像一个听话的助手:你指哪它打哪,但不指就不动。
这是 Level 2——半自主。AI 可以自己读文件和分析,但涉及修改和执行,它必须等你点头。
阶段三:AI 是实习生
2025 年,小李开始用 Claude Code。某天他输入了:
小李:项目里所有 API 端点都没有错误处理,帮我加上。
AI:(搜索所有 API 路由文件)发现 12 个端点文件。我先分析每个端点的错误类型,然后逐个添加 try-catch 和统一错误响应格式。开始执行……
AI:(读取文件 1 → 分析 → 修改 → 读取文件 2 → 分析 → 修改 → ……)已完成 12 个端点的错误处理,新增了统一的
errorHandler.ts。要跑一下测试吗?
AI 不再只是一问一答,它有了目标,有了计划,有了循环执行的能力。它像一个实习生:你给一个任务,它自己拆解、自己执行、自己检查,完成后汇报结果。
这是 Level 3-4——自主执行。
三个阶段的本质区别
从 Chat 到 Agent,不是「变得更聪明」,而是获得了三种新能力:
| 能力 | Chat | Agent |
|---|---|---|
| 工具使用 | 无,只能生成文本 | 能读文件、跑命令、调 API |
| 循环执行 | 单次问答,不迭代 | 思考→行动→观察→再思考,直到完成 |
| 目标追踪 | 没有目标概念 | 知道「任务是什么」「完成没有」 |
核心公式
Agent = 自主决策 + 工具使用 + 循环执行 + 目标追踪
那为什么不是所有 AI 都是 Agent?
小李想:既然 Agent 这么强,为什么 AI 不直接都变成 Agent?
答案很简单:自主性是有代价的。
- Agent 每一步都在消耗 Token,一个复杂任务可能花掉 10 美元
- Agent 可能走偏——你让它修 Bug,它把整个模块重写了
- Agent 可能陷入死循环——不断尝试、不断失败、不断重试
所以,Agent 不是万能的。简单问答用 Chat,复杂任务用 Agent,关键在于判断——什么时候该让 AI 自己干,什么时候该你亲自把关。
这个问题,我们在 1.3 你需要 Agent 吗? 会详细讨论。但在此之前,让我们先看看历史——2023 年那场「AI 自主化」的狂热,以及它留下的教训。
本节核心要点
- Chat 是一问一答的顾问,Agent 是能自主执行的实习生
- Agent 的三种核心能力:工具使用、循环执行、目标追踪
- 自主性从 Level 0 到 Level 5,不是越高越好
- Agent 有代价:Token 消耗、走偏风险、死循环可能
思考题:回想你最近一次使用 AI 编程工具的场景,它是在哪个层级?有没有哪些任务你希望它更自主,但又不敢放手?
下一节预告:2023 年,AutoGPT 让全世界以为 AI Agent 的时代已经到来。但狂热过后,留下了什么教训?