二、 Agent核心架构深度剖析
12/19/2025
Agent
1. Agent整体架构图
让我们先看一张完整的Agent架构图,理解各个组件如何协同工作:

2. 架构分层解析
这个架构可以分为四个核心层:
第一层:感知层(Perception Layer)
- 作用:接收并理解用户输入
- 组件:用户输入 → 大语言模型理解
- 类比:就像人的耳朵和眼睛
第二层:认知层(Cognition Layer)
- 作用:分析、推理、规划
- 组件:LLM Brain + 规划模块 + 推理引擎
- 类比:就像人的大脑
第三层:执行层(Execution Layer)
- 作用:调用各种工具完成任务
- 组件:工具集(搜索、代码、API等)
- 类比:就像人的手脚
第四层:记忆层(Memory Layer)
- 作用:存储和检索信息
- 组件:短期记忆 + 长期记忆
- 类比:就像人的记忆系统
3. 数据流转过程
让我用一个具体例子说明数据如何在架构中流转:任务:「找出2024年诺贝尔物理学奖获得者,并总结他们的主要贡献」
ReAct Agent 工作流程示例(Thought–Action–Observation)
1#### ReAct Agent 工作流程示例(Thought–Action–Observation)
2
3步骤1: 用户输入
4 → 进入规划模块:识别需要「搜索」和「总结」两个步骤
5
6步骤2: 规划完成
7 → 进入推理引擎(ReAct框架)
8
9步骤3: 第一轮思考-行动-观察循环
10 Thought: "我需要搜索2024年诺贝尔物理学奖获得者"
11 Action: 调用搜索工具search("2024 Nobel Prize Physics")
12 Observation: 获得搜索结果→ "John Hopfield和Geoffrey Hinton"
13
14步骤4: 第二轮思考-行动-观察循环
15 Thought: "我需要了解他们的贡献"
16 Action: 调用搜索工具search("Hopfield Hinton 神经网络贡献")
17 Observation: 获得详细信息→ "人工神经网络和机器学习基础"
18
19步骤5: 综合信息
20 → LLM整合所有观察结果
21 → 生成结构化答案
22 → 存入记忆模块(长期记忆)
23
24步骤6: 输出结果
25 → 返回完整答案给用户这个过程中,Agent不是一次性生成答案,而是通过多轮思考-行动-观察的循环,逐步接近最终答案。这就是Agent比传统LLM强大的地方。