跳至内容

智能体工程 · 提示词、记忆、工具链全解

Agent Engineering — prompts, memory, tools, all three at once
2026年4月22日
智能体工程 · 提示词、记忆、工具链全解
赵博

2025 年,"提示词工程"这个词悄悄退场。取而代之的是一个更大的概念:智能体工程 Agent Engineering —— 它包含提示词,但远不止提示词。 一个合格的智能体工程师,今天要同时懂三件事:怎么写 prompt · 怎么设计记忆 · 怎么挂工具

图一 · 智能体工程 · 齿轮咬合般的三层协作
图一 · 智能体工程 · 齿轮咬合般的三层协作

一 · 智能体的基本方程式 The Agent Formula

最简洁的定义:

Agent = LLM + Loop + Tools + Memory
A model, in a loop, with hands and notes.

LLM 负责思考,Loop 决定"再来一次还是停下",Tools 是它的手脚,Memory 是它的笔记本。四个部件任何一个缺位,它就退回到聊天机器人。

二 · 提示词 · 从艺术到架构 Prompt as Architecture

图二 · Prompt 不是文案,是架构蓝图
图二 · Prompt 不是文案,是架构蓝图

1. System vs User vs Developer

2026 年的最佳实践 —— 一个 prompt 至少分三层:

  • System —— agent 的身份、权限、风格,稳定几周不变,享受 prompt caching 红利。
  • Developer (Anthropic/OpenAI 推的新层) —— 当前会话的工具说明、业务规则。
  • User —— 真正的用户输入。

2. 结构化,别叙事化

<section>...</section> 标签把 prompt 分块 —— Claude 对 XML-like 结构化标签的识别度远高于纯自然语言。OpenAI 模型更喜欢 Markdown 分节。

3. Few-shot 的时代过去了

基础模型已经足够聪明,写 3 个好的 rule 胜过 10 个 few-shot 样例。Few-shot 仍然有用 —— 但只用在"教格式"和"教风格"上,而不是"教任务"。

三 · 记忆 · 分层设计 Memory Hierarchy

图三 · 记忆系统分层 · 工作区 · 情景 · 语义 · 程序性
图三 · 记忆系统分层 · 工作区 · 情景 · 语义 · 程序性

参考人类认知科学,agent 的记忆最好分四层:

人脑对应技术实现存活周期
工作记忆短期当前 context window一轮对话
情景记忆日记对话日志 · session store一个 session
语义记忆常识向量库 (RAG)长期
程序性记忆肌肉记忆模型权重 · fine-tune永久

生产级 agent 会同时用到至少三层。忽略任何一层,都会让 agent 表现得像一个"失忆症患者"或"书呆子"。

四 · 工具 · Agent 的手脚 Tools are the Body

图四 · 工具集 · 每一把都要刻好
图四 · 工具集 · 每一把都要刻好"说明书"

1. 工具描述 = 第二段 prompt

模型通过工具的 name + description + schema 三件套来决定用不用、怎么用。写工具描述的难度不亚于写 system prompt。

2. MCP 是新标准

2026 年几乎所有主流 agent 框架都支持 MCP。写一个 MCP server,就等于给 Claude / GPT / 自研 agent 同时授权 —— 别再给每个框架单独适配了。

3. Tool design 原则

  • 原子性 —— 一个工具做一件事,比"万能工具"好调试。
  • 幂等性 —— agent 重试不应该把数据库写两次。
  • 错误消息要说人话 —— 错误是给模型看的,写 stacktrace 不如写"你忘了传 user_id"。
  • 返回值节制 —— 别把 10 万行 JSON 塞回 context,先 summarize 或分页。

五 · 编排模式 Patterns

→ ReAct · 先想后做

最经典:Thought → Action → Observation → Thought... 对调试很友好,因为能看到每一步的"推理痕迹"。

→ Plan-and-Execute · 先计划再行动

先让模型写一个 plan 到 TODO list,然后逐条执行。适合长任务,让 agent 有"全局观"。

→ Orchestrator-Worker · 主从架构

主 agent 只做决策,子 agent 做执行。Claude Code / Cursor 用的都是这个模式。

→ Reflection · 自我批判

在做完任务后,让模型对照 checklist 审视一遍自己的输出。便宜、有效、减少"草率收尾"。

六 · 从 Prompt Engineering 到 Context Engineering

2024 年:我们问"怎么问模型"
2026 年:我们问"怎么把需要的上下文放进模型看得到的地方"
From prompt engineering to context engineering — that's the real upgrade.

智能体工程的本质,是工程 —— 有架构、有测试、有监控、有版本控制。它不是一段咒语,它是一个软件系统。

想让智能体在你的业务里落地?
从需求梳理到架构设计到上线监控 · 辉火云管家全流程。
了解 AI 平台 →

— 青岛火一五信息科技 · 2026 年 4 月 —

Anthropic Managed Agent 深度解析
Inside the Claude Agent SDK — what "managed" really means