实用至上：智能体/Agent 是什么

用户5069

2025年8月25日修改

Agent 的起源

不做词义追源，仅从大众角度，这个事儿是去年初开始的，也就是 2023 年 2-3 月。标志性事件包括：​​

AutoGPT 等开源项目的发布，这是第一批基于自然语言的 AI 自动化实践：你告诉它一个任务，它就会通过自然语言的自我对话，将这个任务进行拆分、规划并实现。​

斯坦福小镇一类的项目实践：给予不同的 Bot 以不同的人格，搭配记忆窗口，让它们之间相互对话。​

发表于 2 月的论文《Toolformer: 大模型可以教自己使用工具》，以及 OpenAI 在 3 月底发布的插件计划：这意味着，大模型从原来的“思想家”，通过对外部工具的使用，变成了实干家。​

现在的 Agent

时至今日，对于 Agent 是什么，可能还没有一个标准的定义。

一个常见的观点是，Agent 是一种让 AI 以类似人的工作和思考方式，来完成一系列的任务。一个 Agent 可以是一个 Bot，也可以是多个 Bot 的协同。就像是职场里，简单的工作独立完成，复杂的工作协作完成一样。​

对于每个 Bot 来说，可能会包括：

•
一个大脑：判断和规划行为，这里通常用 GPT-4或同水平的 LLM；​

•
眼睛和手：确认信息和使用外部工具，一般是各种插件/action/api；​

•
工作纪要：储存已经发生的事，通常的媒介是上下文窗口，或者数据库；  ​

•
行为SOP：明确这个 Agent 的身份、任务、目标和机制。这个 SOP 可能是用户给的，也可能是由其它 Bot 给出的。​

再具象一点，这里我从 GPTs 里截了个图：

实用至上：智能体/Agent 是什么​