什么是大语言模型(LLM)
大语言模型(Large Language Model,简称 LLM)是 AI Agent 的大脑,理解它是构建智能 Agent 的基础。
大语言模型是一个经过海量文本数据训练的深度学习模型,它能够理解和生成人类语言。
LLM 的核心能力
- 文本生成:根据输入生成连贯的文本
- 意图理解:理解用户的真实需求
- 逻辑推理:进行多步逻辑推演
- 知识问答:回答各类知识性问题
- 代码编写:生成和理解程序代码
主流 LLM 模型
| 模型 | 特点 |
|---|---|
| GPT-4 | OpenAI出品,多模态 |
| Claude | Anthropic出品,注重安全 |
| DeepSeek | 国产开源 |
| Gemini | Google出品,多模态 |
LLM 与 Agent 的关系
LLM 扮演大脑角色:意图理解、任务分解、决定是否调用外部工具。LLM的”智力天花板”决定了整个Agent的上限。
来源:菜鸟教程 | 原文链接