Harness工程:从上下文管理到Agent系统构建

978-7-115-69795-0
作者: 邢云阳
译者:
编辑: 贾静

图书目录:

第 1章 从提示词到上下文工程 1

1.1 上下文工程的核心思想 1

1.1.1 从购车决策看上下文的构建 2

1.1.2 上下文工程与Agent的关系 5

1.2 上下文工程的系统结构 6

1.2.1 上下文构建的四大模块 6

1.2.2 上下文管理的核心策略 7

1.3 简单工具调用到复杂Agent:Agent技术发展路线图 8

1.3.1 简单工具调用Agent的原理与特点 8

1.3.2 深度思考型Agent的原理与特点 11

1.3.3 以代码执行为主的Agent:Code Agent的原理与特点 13

1.3.4 多Agent的原理与特点 14

第 2章 上下文的“元驱动”:意图识别、 规划等模块的工程化实战 16

2.1 意图识别:让AI精准理解人类需求 16

2.1.1 意图识别的作用与意义 16

2.1.2 基于Arch-Router实现意图识别 18

2.1.3 小模型微调+大模型兜底实现意图识别 24

2.2 计划模式:让AI有计划地解决问题 30

2.2.1 简单计划模式实现旅游攻略撰写 30

2.2.2 复杂计划模式实现通用计划执行 39

2.3 反思模式:让AI具备“思考自己的思考”能力 47

2.3.1 反思模式的架构 47

2.3.2 以运维场景为例实现反思模式工作流 48

2.4 行动:代码即工具的CodeAct模式 53

2.4.1 CodeAct模式的架构 53

2.4.2 以图表生成助手为例实现CodeAct Agent 54

2.5 人机协作:实现Human-in-the-loop模式 60

2.5.1 Human-in-the-loop模式的原理 60

2.5.2 以报告大纲审核为例实现强制人类介入 61

2.5.3 以商品咨询为例实现自主触发人类介入 66

第3章 DeepResearch:基于深度思考Agent构建上下文的典型案例 70

3.1 深度解析DeepResearch核心演进 70

3.1.1 RAG的原理与局限 70

3.1.2 DeepSearch的机制与不足 71

3.1.3 DeepResearch的核心架构:从搜索转向研究 72

3.2 实战:构建DeepSearch核心引擎 73

3.2.1 选型博查(Bocha):适配中文生态的AI搜索引擎 73

3.2.2 SearXNG:开源聚合搜索引擎的深度应用 79

3.3 实战:Sequential Thinking方案的DeepResearch代码实现 84

3.3.1 MCP广场:Smithery.ai简介 84

3.3.2 深度思考MCP:Sequential Thinking原理介绍 85

3.3.3 私有化方式部署Sequential Thinking 89

3.3.4 构建DeepResearch深度研究系统 92

第4章 记忆工程:Agent系统的长短期上下文管理 101

4.1 深入理解Agent记忆 101

4.1.1 短期记忆:突破LLM的无状态局限 101

4.1.2 长期记忆:构建Agent的持久化存储层 104

4.2 Mem0:Agent记忆层的标准化实现 105

4.2.1 Mem0核心架构:多层级记忆管理 105

4.2.2 记忆生命周期:从信息提取到持久化存储 106

4.2.3 Mem0实战:基于混合存储架构实现历史对话复用 107

4.3 容器化的高可用分布式记忆系统部署方案 115

4.3.1 部署架构设计与脚本编写 115

4.3.2 基于分布式记忆系统的历史对话复用 118

第5章 Skills:上下文卸载的艺术 123

5.1 Skills概述 123

5.1.1 Skills是什么 123

5.1.2 Skills的结构定义 124

5.1.3 Skills的渐进式加载机制 125

5.1.4 如何设计支持Skills的Agent 126

5.2 实战:零代码开发“运维巡检Skill” 127

5.2.1 使用扣子编程开发“运维巡检Skill” 127

5.2.2 基于OpenClaw测试“运维巡检Skill” 132

第6章 Harness工程实践:复现Claude Code核心设计模式 135

6.1 Agent Loop:Agent可以长时间工作的核心 136

6.1.1 一个Agent=一个Loop+一个Bash工具 136

6.1.2 增加更多的基础工具 141

6.2 上下文工程:解析Claude Code如何进行上下文管理 146

6.2.1 SubAgent:分离上下文窗口 147

6.2.2 Skills:让Agent实现渐进式加载 152

6.2.3 Compact:多级上下文压缩机制 157

6.3 持久化与异步:跨会话的任务管理 162

6.3.1 Todo:Claude Code的计划模式 163

6.3.2 Task System:持久化的任务系统 166

6.3.3 后台任务:慢操作交给后台运行 173

6.4 多Agent系统:Agent Teams 178

6.4.1 团队管理类实现 179

6.4.2 通信总线的实现 181

6.4.3 为队友的Agent Loop增加工具调用 183

6.4.4 修改主Agent的Agent Loop逻辑 183

6.4.5 测试效果 184

第7章 Harness工程实践:Claw类产品的设计模式解析与实践 188

7.1 Claw类产品的核心架构 188

7.1.1 学习路径:从NanoClaw开启探索 188

7.1.2 NanoClaw的架构 189

7.2 开发与使用NanoClaw 192

7.2.1 为NanoClaw开发飞书Channel 192

7.2.2 部署NanoClaw 194

详情

本书系统阐述从上下文工程到Harness工程(Harness Engineering)的技术演进路径,深入揭示AI Agent从工具调用到自主思考与协作的核心原理及工程落地方法。全书共7章,以通过Agent工程化的构建方式落地上下文与Harness相关技术为主线,帮助读者系统掌握构建具备理解、计划、反思与行动能力的Agent系统的完整方法论。 第1章、第2章系统介绍上下文工程的理论基础,涵盖意图识别、计划模式、反思模式、CodeAct行动及人机协作五大核心能力的工程化实战;第3章、第4章以DeepResearch 和记忆工程为典型案例,提供从搜索到研究的完整代码实现及分布式记忆系统部署方案;第5章阐述Skills上下文卸载技术,并给出使用扣子编程开发“运维巡检Skill”及基于OpenClaw测试“运维巡检Skill”两个实战案例;第6章、第7章走向Harness工程,通过两个实践案例介绍如何复现Claude Code核心特性,以及如何构建OpenClaw类产品,实现技术整合与工程落地。每章均配有可落地的代码示例与真实场景案例。 本书既适合具备开发背景的工程师、架构师阅读,也适合希望提升AI Agent实战能力的技术人员参考。

图书摘要

相关图书

Python编程快速上手——让烦琐工作自动化(第3版)
Python编程快速上手——让烦琐工作自动化(第3版)
人人都是AI程序员:TRAE+Cursor 从0到1全栈实战
人人都是AI程序员:TRAE+Cursor 从0到1全栈实战
精通MCP:AI智能体开发实战
精通MCP:AI智能体开发实战
C++程序设计语言(第4版)(上、下册)
C++程序设计语言(第4版)(上、下册)
DeepSeek原理与项目实战大模型部署、微调与应用开发
DeepSeek原理与项目实战大模型部署、微调与应用开发
驾驭 Gemini 3与Nano Banana:人人都是AI产品创客
驾驭 Gemini 3与Nano Banana:人人都是AI产品创客

相关文章

相关课程