1.2 AutoGPT 的教训——2023 年那场 AI 自主化狂热
2023 年 3 月,GitHub 上一个项目突然爆火。它叫 AutoGPT,一周内获得 10 万 Star,成为当时增长最快的开源项目。
全世界都沸腾了——AI 终于能自己干活了!
AutoGPT 做了什么
AutoGPT 的想法很简单:给 GPT-4 一个目标,让它自己想办法。
小李试了一下:
小李:研究一下 2024 年 AI 行业趋势,写一份报告。
AutoGPT:好的,我来分解任务——
- 搜索 "AI industry trends 2024"
- 阅读搜索结果
- 整理要点
- 撰写报告
(搜索中……)
AutoGPT:我找到了 10 篇文章。让我阅读第一篇……
(阅读中……)
AutoGPT:这篇文章提到了大模型和 Agent。让我搜索更多关于 Agent 的信息……
(再次搜索……)
AutoGPT:找到了更多文章。让我阅读……
(阅读中……)
AutoGPT:这些文章提到了新的框架。让我搜索这些框架的详细信息……
30 分钟后,小李的 GPT-4 账单增加了 15 美元,报告还没有写出来。
三大经典问题
AutoGPT 的失败不是偶然的。它暴露了早期 Agent 的三个根本性问题:
1. 无限循环——停不下来
AutoGPT 最常见的问题:不知道什么时候该停。
它搜索 → 阅读 → 发现新线索 → 再搜索 → 再阅读 → 又发现新线索……永远在「再多查一点」的循环中打转。
搜索 → 阅读 → 发现新关键词 → 搜索 → 阅读 → 发现新关键词 → ……这就像一个没有截止日期的研究员——永远觉得「还不够完整」,永远在收集资料,永远交不出报告。
2. 走偏——忘了目标
AutoGPT 的第二个问题:容易偏离原始目标。
你让它研究 AI 趋势,它搜着搜着,被一篇关于量子计算的文章吸引,然后开始研究量子计算,接着又绕到了量子力学的基础理论……
等它回过神来(如果它能回过神来的话),原始任务已经被抛到九霄云外。
3. 高成本——Token 无底洞
每一次搜索、每一次阅读、每一次「思考」,都在消耗 Token。AutoGPT 没有成本意识,也不关心你的预算。
- 简单任务:$5-10
- 中等任务:$15-30
- 复杂任务:可能超过 $100,而且不一定完成
同时期的其他尝试
AutoGPT 不是孤例。2023 年春天,一批类似的 Agent 项目同时涌现:
| 项目 | 时间 | 核心思路 | 结果 |
|---|---|---|---|
| AutoGPT | 2023.03 | 给目标,自己干 | 爆火,但实际效果差 |
| BabyAGI | 2023.04 | 任务队列驱动 | 架构更清晰,但同样容易跑偏 |
| AgentGPT | 2023.04 | 浏览器可视化 | 降低了门槛,但没解决核心问题 |
这些项目有一个共同的盲点:只关注「让 AI 能自主行动」,却忽略了「如何让 AI 在正确的方向上行动」。
时间线:Agent 的关键节点
理解这段历史很重要,因为今天的 Agent 设计都在回应 2023 年的教训:
教训是什么
2023 年的狂热给我们留下了三条核心教训:
教训一:自主 ≠ 放手
让 Agent 自主行动,不等于让它在无人监督的情况下随意行动。人类控制不是 Agent 的敌人,而是 Agent 的安全带。
教训二:能干 ≠ 会干
Agent 有了工具和循环能力,不代表它能用好。没有好的设计模式,Agent 的「能干」只会让它以更快的速度做错事。
教训三:想法 ≠ 实现
AutoGPT 的想法没有错——给 AI 一个目标,让它自己干。错的是:没有执行边界、没有质量检查、没有成本意识。
这三条教训,贯穿了本课程的核心。我们在后续的每一节中,都会回到这三个问题:怎么控制方向、怎么设计模式、怎么设定边界。
本节核心要点
- 2023 年 AutoGPT 让全世界看到了 Agent 的可能性,也暴露了三大问题
- 无限循环、走偏、高成本是早期 Agent 的通病
- 三条教训:自主不等于放手、能干不等于会干、想法不等于实现
- 今天的 Agent 设计都在回应这些教训——可控自主、设计模式、执行边界
思考题:如果你是 AutoGPT 的开发者,你会怎么解决「无限循环」问题?提示:想想人类是怎么避免无限循环的。
下一节预告:既然 Agent 有代价,那什么时候该用、什么时候不该用?让我们看看自主性光谱,找到你的定位。