分享
实用至上:智能体/Agent 是什么
输入“/”快速插入内容
实用至上:智能体/Agent 是什么
用户5069
2025年8月25日修改
Agent 的起源
不做词义追源,仅从大众角度,这个事儿是去年初开始的,也就是 2023 年 2-3 月。标志性事件包括:
AutoGPT 等开源项目的发布,这是第一批基于自然语言的 AI 自动化实践:你告诉它一个任务,它就会通过自然语言的自我对话,将这个任务进行拆分、规划并实现。
斯坦福小镇一类的项目实践:给予不同的 Bot 以不同的人格,搭配记忆窗口,让它们之间相互对话。
发表于 2 月的论文《Toolformer: 大模型可以教自己使用工具》,以及 OpenAI 在 3 月底发布的插件计划:这意味着,大模型从原来的“思想家”,通过对外部工具的使用,变成了实干家。
现在的 Agent
时至今日,对于 Agent 是什么,可能还没有一个标准的定义。
一个常见的观点是,Agent 是一种让 AI 以类似人的工作和思考方式,来完成一系列的任务。一个 Agent 可以是一个 Bot,也可以是多个 Bot 的协同。就像是职场里,简单的工作独立完成,复杂的工作协作完成一样。
对于每个 Bot 来说,可能会包括:
•
一个大脑
:判断和规划行为,这里通常用 GPT-4或同水平的 LLM;
•
眼睛和手
:确认信息和使用外部工具,一般是各种插件/action/api;
•
工作纪要
:储存已经发生的事,通常的媒介是上下文窗口,或者数据库;
•
行为SOP
:明确这个 Agent 的身份、任务、目标和机制。这个 SOP 可能是用户给的,也可能是由其它 Bot 给出的。
再具象一点,这里我从 GPTs 里截了个图: