1.1 从聊天到行动——小李的 AI 助手进化之路

小李是一个全栈开发者，每天和代码、文档、Bug 打交道。他和 AI 的关系，经历了三个阶段。

阶段一：AI 是顾问

2024 年初，小李开始用 ChatGPT 写代码。模式很简单：

小李：帮我写一个 JWT 验证的中间件。
AI：好的，这是代码……
小李：帮我解释一下这段代码。
AI：这段代码的作用是……

一问一答，AI 像一个知识渊博的顾问。你问什么，它答什么。不问，它就不动。

这个阶段，小李的 AI 是 Level 0——被动响应。它没有目标，没有主动性，更不会自己去查项目、找文件、跑测试。

阶段二：AI 是助手

2024 年中，小李换上了 Cursor。他发现 AI 变了——

小李：帮我修一下登录页的 Bug，用户点登录没反应。
AI：（读取 login.tsx）我发现按钮的 onClick 没有绑定 handleSubmit。要修改吗？
小李：改吧。
AI：（修改文件）已修复。要跑一下测试吗？

AI 有了工具——能读文件、改代码、跑命令。但每一步都要小李确认。它像一个听话的助手：你指哪它打哪，但不指就不动。

这是 Level 2——半自主。AI 可以自己读文件和分析，但涉及修改和执行，它必须等你点头。

阶段三：AI 是实习生

2025 年，小李开始用 Claude Code。某天他输入了：

小李：项目里所有 API 端点都没有错误处理，帮我加上。
AI：（搜索所有 API 路由文件）发现 12 个端点文件。我先分析每个端点的错误类型，然后逐个添加 try-catch 和统一错误响应格式。开始执行……
AI：（读取文件 1 → 分析 → 修改 → 读取文件 2 → 分析 → 修改 → ……）已完成 12 个端点的错误处理，新增了统一的 errorHandler.ts。要跑一下测试吗？

AI 不再只是一问一答，它有了目标，有了计划，有了循环执行的能力。它像一个实习生：你给一个任务，它自己拆解、自己执行、自己检查，完成后汇报结果。

这是 Level 3-4——自主执行。

三个阶段的本质区别

1顾问Level 0

💬 问一句，答一句

❌ 没有工具，没有记忆，没有主动性

2助手Level 1-2

🛠️ 有工具，需确认

⚡ 你指哪，它打哪；不指就不动

3实习生Level 3-5

🎯 有目标，能执行

✅ 自己拆解、自己检查、自己汇报 Agent

从 Chat 到 Agent，不是「变得更聪明」，而是获得了三种新能力：

能力	Chat	Agent
工具使用	无，只能生成文本	能读文件、跑命令、调 API
循环执行	单次问答，不迭代	思考→行动→观察→再思考，直到完成
目标追踪	没有目标概念	知道「任务是什么」「完成没有」

核心公式

Agent = 自主决策 + 工具使用 + 循环执行 + 目标追踪

那为什么不是所有 AI 都是 Agent？

小李想：既然 Agent 这么强，为什么 AI 不直接都变成 Agent？

答案很简单：自主性是有代价的。

Agent 每一步都在消耗 Token，一个复杂任务可能花掉 10 美元
Agent 可能走偏——你让它修 Bug，它把整个模块重写了
Agent 可能陷入死循环——不断尝试、不断失败、不断重试

所以，Agent 不是万能的。简单问答用 Chat，复杂任务用 Agent，关键在于判断——什么时候该让 AI 自己干，什么时候该你亲自把关。

这个问题，我们在 1.3 你需要 Agent 吗？会详细讨论。但在此之前，让我们先看看历史——2023 年那场「AI 自主化」的狂热，以及它留下的教训。

本节核心要点

Chat 是一问一答的顾问，Agent 是能自主执行的实习生
Agent 的三种核心能力：工具使用、循环执行、目标追踪
自主性从 Level 0 到 Level 5，不是越高越好
Agent 有代价：Token 消耗、走偏风险、死循环可能

思考题：回想你最近一次使用 AI 编程工具的场景，它是在哪个层级？有没有哪些任务你希望它更自主，但又不敢放手？

下一节预告：2023 年，AutoGPT 让全世界以为 AI Agent 的时代已经到来。但狂热过后，留下了什么教训？

下一节：AutoGPT 的教训 →

1.1 从聊天到行动——小李的 AI 助手进化之路 ​

阶段一：AI 是顾问 ​

阶段二：AI 是助手 ​

阶段三：AI 是实习生 ​