AI Infra Foundation

AI Agent

ReAct · 工具调用 · 记忆 · 多 Agent 协作 · 工程实践

agentllmreactfunction-callingraginterview
当前模块
学习进度0 / 4
Module Switcher
Agent 内容模块
原理2
工程与面试2
内容模块

基础概念

基础★☆☆⏱ 12 min

一句话结论

Agent 的本质是 LLM 驱动的循环决策系统:观察、思考、调用工具、接收反馈、继续行动。

复习定位

维度内容
所属模块AI Agent
章节类型概念类
解决问题围绕 ReAct、Plan-Execute、记忆、工具调用、RAG、多 Agent 协作和工程风险建立 Agent 面试答案。
面试抓手先讲模式,再讲工程边界。

什么是 AI Agent

AI Agent 是一个能感知环境、自主决策、执行动作的智能体。和传统 LLM Chat 不同,Agent 不只是回答问题,而是能使用工具、维护状态、多步推理、在真实环境中完成目标

维度LLM ChatAI Agent
交互模式单轮或多轮对话多步推理 + 工具调用 + 环境交互
状态管理对话历史(无持久状态)短期记忆 + 长期记忆 + 任务状态
能力边界仅文本生成搜索、计算、代码执行、API 调用、文件操作
错误处理依赖用户纠正自我反思、重试、fallback 策略
典型产出回答、摘要、翻译完成任务、生成报告、自动化工作流

Agent 核心架构

一个典型的 Agent 由四个核心模块组成,面试中要能画出这个架构并解释每个模块的职责。

AI Agent 核心架构 LLM + 记忆 + 工具 + 规划 = Agent LLM 大脑 推理、理解、生成 GPT-4 / Claude / Gemini 记忆系统 短期(上下文窗口) 长期(向量库 / DB) 工具系统 搜索、计算、API、代码 Function Calling / MCP 规划与执行 任务分解、调度 反思、纠错、重试 环境 Web / OS API / DB

ReAct:推理 + 行动

ReAct(Reasoning + Acting)是当前最主流的 Agent 范式,由 Google 在 2022 年提出。核心思想是让 LLM 交替进行思考(Thought)→ 行动(Action)→ 观察(Observation),直到任务完成。

步骤说明示例
Thought分析当前状态,决定下一步做什么"我需要先查一下今天的天气"
Action调用工具或执行操作search("北京今天天气")
Observation获取工具返回结果"北京今天晴,25°C"
...循环...重复直到任务完成或达到最大步数"天气不错,可以推荐户外活动"
Final Answer汇总所有信息,给出最终答案"今天北京晴,适合去颐和园"
ReAct 的优势
  • 可解释性:每一步的 Thought 让用户看到推理过程。
  • 错误恢复:Observation 不理想时可以调整策略重试。
  • 减少幻觉:通过工具获取真实信息,而非纯靠模型记忆。
  • 灵活组合:可以在一次任务中调用多种工具。
ReAct 的局限
  • 每步都需要 LLM 调用,延迟高、成本大。
  • 长链推理可能累积错误,中间步骤的偏差会放大。
  • 对复杂任务的分解能力有限,容易陷入局部循环。

Plan-and-Execute:先规划再执行

Plan-and-Execute 将 Agent 流程分为两个阶段:规划阶段生成完整执行计划,执行阶段按计划逐步调用工具。适合步骤明确、依赖关系清晰的任务。

对比维度ReActPlan-and-Execute
决策方式每步实时决策先全局规划,再逐步执行
全局最优可能陷入局部最优有机会找到全局较优路径
灵活性高,可随时调整低,计划变更成本高
延迟每步一次 LLM 调用规划一次 + 执行 N 次
适用场景探索性、不确定性高结构化、步骤明确

思维链与思维树

CoT(Chain-of-Thought)和 ToT(Tree-of-Thoughts)是提升 LLM 推理能力的两种提示技术,也是 Agent 规划能力的基础。

技术核心思想适用场景局限
CoT让模型在输出答案前先写出推理步骤数学、逻辑、多步推理线性推理,不会回溯
CoT-SC多次采样 CoT,取多数结果(Self-Consistency)有明确答案的推理任务成本翻倍,不适用于开放式任务
ToT维护推理树,在多个分支间搜索最优路径规划、创作、需要探索的任务计算成本极高,需要评估函数
GoTGraph-of-Thoughts,将推理建模为有向图复杂多步推理,信息融合工程复杂度高
面试要点:CoT 是推理增强,ReAct 是推理+行动。Agent 通常需要两者结合:用 CoT 做内部推理,用 ReAct 做外部交互。

关联模块

  • GPU 硬件与资源共享:提供硬件、显存、互联和利用率诊断基础。
  • LLM 推理系统 / 分布式训练:提供大模型系统中的实际落点。
  • Kubernetes / 调度与集群:提供平台、资源和多租户治理语境。
  • 专题综合题 / 论文工作:把基础知识组织成可复述的方案和项目叙事。