认知篇 EP.01

从 Agent Framework 到 Agent Harness — Deep Agents 的诞生逻辑

本章是《Deep Agents 实战》系列的开篇。我们不急着写代码,而是先回答一个根本问题:在 Agent 开发领域已经有那么多框架的今天,Deep Agents 为什么还要存在?它解决了什么问题?

一个真实的困境

假设你要构建一个 AI 编程助手。它需要:

如果你从零开始用 LangChain 搭建,你会发现自己在重复造轮子:手写文件读写工具、手写任务追踪逻辑、手写子 Agent 的调度机制……而这些能力,几乎每一个”认真”的 Agent 应用都需要。

这就是 Deep Agents 要解决的问题。

Agent 开发的三个层次

在 LangChain 的技术栈中,Agent 开发被划分为三个层次。理解这三个层次,是理解 Deep Agents 定位的关键。

底层:Agent Runtime(运行时层)— LangGraph

Agent Runtime 是整个技术栈的基座,它解决的是”Agent 怎么可靠地运行”的问题:

LangGraph 就是这个底层运行时。它提供了一个基于图(Graph)的执行引擎,支持上面所有这些生产级特性。你可以把它理解为 Agent 世界的”操作系统”——所有上层应用都运行在它之上。

同一层的其他选手包括:Temporal、Inngest 等持久化执行引擎。

中间层:Agent Framework(框架层)— LangChain

Agent Framework 构建在 Runtime 之上,提供更高层次的开发体验:模型抽象、工具接口、Agent 循环、中间件(Middleware)等。

LangChain 就是这样一个框架。LangChain 1.0 构建在 LangGraph 之上——它利用 LangGraph 的图执行引擎和状态管理能力,但对外提供了更简洁的 API。你在使用 LangChain 时,通常不需要直接接触 LangGraph 的底层 API:

from langchain import create_agent

agent = create_agent(
    model="gpt-4.1",
    tools=[web_search, calculator],
    system_prompt="You are a helpful assistant."
)

框架层的价值在于标准化易上手。你不需要关心底层的执行引擎、状态持久化逻辑,框架帮你处理好了。

同一层的其他选手包括:Vercel 的 AI SDK、CrewAI、OpenAI Agents SDK、Google ADK、LlamaIndex 等。

上层:Agent Harness(工具层)— Deep Agents

这是最上面的一层,也是本系列课程的主角。

Agent Harness 是一个”开箱即用”的 Agent 套件,它在 Runtime 和 Framework 的基础上,预置了一整套经过验证的工具和能力

这个概念怎么理解?打个比方:

Deep Agents 就是这样一个 Harness。它利用 LangChain 的核心构建块(模型、工具接口),运行在 LangGraph 的运行时之上,并预置了:

能力说明
虚拟文件系统read_filewrite_fileedit_filelsglobgrep 六大文件操作工具
任务规划write_todos 工具,让 Agent 能把复杂任务拆解为可追踪的步骤
子 Agent 委派task 工具,让 Agent 能将子任务派发给专门的 Agent
长期记忆基于 LangGraph Memory Store,支持跨对话的持久化记忆

同一层的其他选手包括:Anthropic 的 Claude Agent SDK、Manus 等。

三层关系一览

用一张表来总结(从底层到上层):

层次代表核心价值适用场景
Runtime(底层)LangGraph持久化执行、流式输出、人机协作、状态管理需要精细控制的长期运行 Agent 和复杂工作流
Framework(中间层)LangChain模型抽象、工具接口、Agent 循环、中间件快速上手、构建标准化的 Agent 应用
Harness(上层)Deep Agents预置工具、提示词、子 Agent、长期记忆复杂多步骤任务、自主性较高的 Agent

三者不是互相替代的关系,而是自底向上层层构建。LangGraph 是底层运行时,LangChain 构建在 LangGraph 之上提供更高层抽象,Deep Agents 则在两者之上提供开箱即用的 Agent 能力。你可以根据需求选择在不同层次上工作——需要最大灵活性就直接用 LangGraph,需要快速开发就用 LangChain,需要解决复杂任务就用 Deep Agents。

Agent 开发三层架构:底层 LangGraph (Runtime)、中间层 LangChain (Framework)、上层 Deep Agents (Harness),侧边 LangSmith 贯穿提供可观测性

为什么需要 Agent Harness?

你可能会问:运行时和框架已经提供了构建 Agent 所需的一切,为什么还需要一个 Harness?

答案来自一个观察:成功的 Agent 产品都长得差不多

看看市面上那些真正能完成复杂任务的 Agent 产品——Claude Code、Manus、Cursor——它们虽然各有特色,但核心能力惊人地相似:

  1. 都有文件系统操作能力:能读写、搜索、编辑文件
  2. 都有任务规划能力:能把大任务拆成小步骤
  3. 都有子任务委派能力:能把部分工作交给子 Agent
  4. 都有上下文管理策略:防止对话过长导致 LLM “失忆”

这些共性不是巧合。当 Agent 面对的任务足够复杂时,这些能力就是必需的。而 Agent Harness 的价值就在于:把这些被验证过的模式固化下来,让你不需要每次都从头实现

Deep Agents 的核心设计理念:Context Engineering

Deep Agents 的技术核心可以用一个概念概括:Context Engineering(上下文工程)。

传统做法的问题

传统的 Agent 开发中,所有信息都塞在 prompt 里:

System: 你是一个编程助手。
User: 请帮我重构 src/ 下的代码。
[附带: 20 个文件的完整内容,共 50000 tokens]

这种做法有几个致命问题:

Deep Agents 的做法

Deep Agents 的解决方案是引入一个虚拟文件系统,让 Agent 像人类一样工作:

这样,Agent 的上下文里只保留当前步骤真正需要的信息,其余的都存在文件系统中,需要时再取。

更巧妙的是,这个”文件系统”是虚拟的、可插拔的

这就是 Context Engineering——不是把所有信息都喂给 LLM,而是为 LLM 构建一个高效获取和管理信息的基础设施

Context Engineering 对比:左侧传统 Prompt Stuffing 导致上下文溢出、注意力稀释、不可扩展;右侧 Deep Agents 通过虚拟文件系统按需读取,实现结构化存储和无限扩展

Deep Agents vs 竞品对比

市场上有三个主要的 Agent Harness:Deep Agents、Claude Agent SDK、Codex SDK。我们来看看它们的异同。

定位差异

维度Deep AgentsClaude Agent SDKCodex SDK
用途通用 Agent(含编程)自定义 AI 编程 Agent预构建的编程 Agent
模型支持模型无关(Anthropic、OpenAI、Google、开源等 100+)绑定 Claude 系列绑定 OpenAI 系列
SDK 语言Python + TypeScriptPython + TypeScriptTypeScript
执行环境本地 + 远程沙箱 + 虚拟文件系统本地本地 + 云端
开源协议MITMIT(底层 Claude Code 专有)Apache-2.0

核心能力对比

三者在核心工具层面非常接近——文件读写、Shell 执行、搜索、规划、子 Agent、MCP、人机协作、Skills——都有覆盖。

真正的差异在架构层面:

Deep Agents 的独有优势:

Claude Agent SDK 的独有优势:

Codex SDK 的独有优势:

三大 Agent Harness 对比:Deep Agents(模型无关、虚拟文件系统、长期记忆)、Claude Agent SDK(Claude 深度集成、Hooks 系统)、Codex SDK(OS 级沙箱、MCP Server 模式),共同能力包括文件读写、Shell 执行、规划、子 Agent 等

如何选择?

Deep Agents 的技术全景

最后,我们用一张图来总结 Deep Agents 在整个 LangChain 生态中的位置:

Deep Agents 技术全景图:顶层 Deep Agents (Harness) 包含文件系统工具、任务规划、子 Agent、可插拔存储后端、长期记忆五大模块;中间层 LangChain (Framework) 和 LangGraph (Runtime);底层 LangSmith 提供可观测性

小结

本章我们理解了 Deep Agents 的设计定位:

  1. Agent 开发分为三个层次:Runtime(LangGraph)→ Framework(LangChain)→ Harness(Deep Agents),自底向上层层构建
  2. Agent Harness 的价值在于将成功 Agent 产品的共性能力(文件系统、任务规划、子 Agent、长期记忆)固化为开箱即用的组件
  3. Context Engineering 是 Deep Agents 的核心理念——用虚拟文件系统按需管理上下文,而不是把所有信息塞进 prompt
  4. 与竞品相比,Deep Agents 的最大优势是模型无关性、虚拟文件系统的可插拔后端、长期记忆、以及完整的生产部署方案

下一章,我们将动手实践,用 5 分钟构建第一个 Deep Agent。

课件下载

相关资源