四大核心组件
如果把 AI Agent 比作一家智能餐厅,它依赖四大核心组件:大脑、工具、记忆、规划。
- 大脑:听懂点单、判定目标、决定顺序
- 工具:把决策转成可执行操作
- 记忆:记录上下文,保证流程不混乱
- 规划:把任务拆成步骤
感知层 (Perception)
负责理解外部输入:文本、图像/视频、结构化数据、环境状态、工具返回结果。
大脑 (Brain)
Agent 最核心部分(GPT-4、Claude、DeepSeek等)。三件核心事:意图理解、推理决策、工具调用。
工具 (Tools)
| 类别 | 常见工具 | 作用 |
|---|---|---|
| 信息获取 | 搜索、网页抓取、文档读取 | 获取实时信息 |
| 计算执行 | 代码解释器、数学引擎 | 处理精确计算 |
| 内容生成 | 图像生成、语音合成 | 产出非文本内容 |
| 系统交互 | API、邮件、日历、文件 | 与外部系统交互 |
记忆 (Memory)
短期记忆保存当前对话历史;长期记忆存储用户偏好、历史任务结果。
规划 (Planning)
将复杂目标分解为可执行子任务,失败时反思原因并调整计划。
来源:菜鸟教程 | 原文链接