深度学习与大模型工程化

978-7-115-69638-0
作者: 金正海肖建于
译者:
编辑: 贾静
分类: 其他

图书目录:

第 一部分 基础入门篇

第 1章 深度学习基础 2

1.1 AI技术演进 2

1.1.1 什么是AI:核心定义与早期技术范式 2

1.1.2 机器学习:实现AI的关键途径 3

1.1.3 深度学习:机器学习的强大引擎 3

1.1.4 AI、机器学习、深度学习和神经网络的关系 4

1.2 基础工具库与线性回归 5

1.2.1 NumPy和Matplotlib库 5

1.2.2 线性回归模型原理 12

1.2.3 线性回归模型训练要素 23

1.2.4 模型预测介绍 26

1.2.5 实例1:从零实现线性回归模型训练 27

1.3 神经网络基础 29

1.3.1 从生物神经元到人工神经网络 29

1.3.2 线性回归模型的神经网络结构 31

1.3.3 多层神经网络 31

1.3.4 神经网络底层原理 32

1.3.5 隐藏层定义与理解 39

1.3.6 激活函数定义与介绍 41

1.3.7 实例2:构建波士顿房价预测的神经网络模型 44

1.4 小结 55

第 2章 PyTorch框架介绍与应用 56

2.1 PyTorch框架简介 56

2.1.1 PyTorch安装 56

2.1.2 PyTorch的数据结构及其与NumPy的异同 57

2.1.3 PyTorch层和块 60

2.1.4 PyTorch自定义块 61

2.2 实例1:Logistic回归实战(解决异或问题) 62

2.2.1 异或问题分析 62

2.2.2 异或问题代码实现 63

2.2.3 异或模型训练 66

2.3 实例2:多项式回归与模型选择 69

2.3.1 多项式回归的一般形式 69

2.3.2 多项式回归的实现 69

2.3.3 模型选择 79

2.4 小结 79

第二部分 计算机视觉模型篇

第3章 计算机视觉核心模型 81

3.1 CNN介绍 81

3.1.1 全连接网络提取图像特征存在的问题 81

3.1.2 CNN的优势 81

3.2 CNN层级结构 82

3.2.1 输入层 82

3.2.2 卷积层 85

3.2.3 激活层 89

3.2.4 池化层 89

3.2.5 全连接层 90

3.3 CNN常用API介绍 91

3.3.1 PyTorch卷积算子API 91

3.3.2 PyTorch最大池化函数 94

3.3.3 实例1:图像中物体的边缘检测和图像均值模糊 94

3.4 批归一化详解 98

3.4.1 批归一化的作用 98

3.4.2 批归一化与激活函数 99

3.4.3 批归一化数学表达式 100

3.4.4 实现批归一化的计算公式 100

3.4.5 实例2:模型的训练模式和评估模式应用 109

3.5 小结 113

第4章 图像分类实战 114

4.1 实例1:猫狗分类研究 114

4.1.1 数据集准备与预处理 114

4.1.2 VGG16网络模型构建 116

4.1.3 VGG16网络模型训练 118

4.1.4 模型优化与预测 119

4.1.5 基于Grad-CAM的模型可视化 121

4.2 实例2:验证码识别 135

4.2.1 网络深度的重要性 135

4.2.2 残差网络的核心思想与解决方案 136

4.2.3 ResNet系列网络 137

4.2.4 验证码识别数据集预处理 138

4.2.5 基于ResNet-18验证码识别的模型构建 142

4.2.6 ResNet-18模型训练与推理 145

4.3 实例3:人脸相似度判断 147

4.3.1 孪生神经网络简介 147

4.3.2 孪生神经网络的构建与微调 148

4.3.3 标签的生成 151

4.3.4 训练与预测过程 152

4.4 小结 155

第5章 目标检测实战 156

5.1 YOLO系列模型解读 156

5.1.1 YOLOv0简介 156

5.1.2 YOLOv1详解 159

5.1.3 YOLOv2改进解析 172

5.2 实例:火焰和烟雾目标检测 176

5.2.1 项目背景 176

5.2.2 Ultralytics YOLOv12的下载与安装 177

5.2.3 数据集处理 177

5.2.4 训练、测试、推理 181

5.2.5 模型导出 184

5.2.6 小样本低资源场景下的优化策略 184

5.3 工业级模型评估指标解读 197

5.3.1 模型评估核心基础 197

5.3.2 评估指标 198

5.3.3 火焰和烟雾目标检测模型训练结果指标分析 200

5.3.4 工业级指标选择与优化策略 203

5.4 小结 205

第三部分 自然语言处理模型篇

第6章 循环神经网络 207

6.1 RNN介绍 207

6.1.1 为什么需要RNN 207

6.1.2 RNN结构解析 208

6.1.3 RNN单元 209

6.1.4 RNN类 213

6.1.5 实例1:使用RNN单元进行字符学习 216

6.1.6 实例2:使用RNN进行字符学习 222

6.1.7 实例3:用词嵌入改进实例2 225

6.2 LSTM介绍 231

6.2.1 LSTM的设计思考 231

6.2.2 LSTM网络结构 231

6.2.3 手动实现LSTM网络结构 233

6.2.4 直接调用PyTorch的LSTM类接口 236

6.3 小结 239

第7章 序列模型工程应用实战 240

7.1 实例1:微博话题识别 240

7.1.1 微博新闻评论数据集介绍 240

7.1.2 数据分析与可视化 240

7.1.3 项目实现思路 243

7.1.4 加载文本数据 243

7.1.5 LSTM模型搭建和训练 245

7.1.6 模型评价指标 248

7.1.7 模型测试 249

7.2 实例2:气温预测 250

7.2.1 CNN-LSTM的算法原理 250

7.2.2 CNN-LSTM的网络结构设计 251

7.2.3 任务描述 252

7.2.4 获取数据集 252

7.2.5 处理时间数据 252

7.2.6 特征数据可视化 253

7.2.7 数据预处理—时间序列样本 255

7.2.8 构建CNN-LSTM混合时空网络模型 259

7.2.9 模型训练 261

7.2.10 预测阶段 262

7.3 小结 263

第8章 注意力机制与机器翻译实战 264

8.1 Seq2Seq模型快速导读 264

8.1.1 Seq2Seq结构介绍 264

8.1.2 注意力机制的设计原理 266

8.2 实例:从中文到英文的翻译 272

8.2.1 环境配置 272

8.2.2 数据加载 272

8.2.3 构建具有注意力机制的Seq2Seq模型 275

8.2.4 图解注意力机制 279

8.2.5 使用模型进行机器翻译推理 282

8.2.6 扩展:贪心搜索与集束搜索 283

8.3 小结 285

第四部分 大模型架构与应用篇

第9章 Transformer原理与实战 287

9.1 Transformer导读 287

9.2 Transformer结构详解 288

9.2.1 位置编码 288

9.2.2 自注意力机制 296

9.2.3 编码器的多头注意力机制 310

9.2.4 编码器的层归一化 313

9.2.5 编码器的逐位前馈网络 317

9.2.6 编码器构建 319

9.2.7 解码器构建详解 321

9.2.8 Transformer模型完整构建 330

9.3 实例:小型中文聊天系统 331

9.3.1 语料准备 332

9.3.2 构建Transformer模型 333

9.3.3 预训练Transformer模型 334

9.3.4 微调Transformer模型 336

9.4 小结 337

第 10章 开源大模型定制开发实战 339

10.1 开源大模型入门 339

10.1.1 什么是开源大模型 339

10.1.2 大模型任务类型 340

10.2 开发环境搭建 340

10.2.1 开源大模型开发工具链 340

10.2.2 算力平台对比分析 342

10.2.3 本地部署与云平台对比 343

10.2.4 基于Transformers库的开源模型本地部署 343

10.3 实例:端到端医疗问答大模型定制 345

10.3.1 数据准备 345

10.3.2 预训练大模型选型 348

10.3.3 训练参数配置 348

10.3.4 基于LoRA的高效微调技术 349

10.3.5 模型推理应用 352

10.3.6 高效微调技术对比与选型 354

10.3.7 开源模型适配性分析与选型建议 356

10.4 小结 358

详情

本书聚焦深度学习与大模型技术的工程化落地,以讲透原理、动手实现代码、提供可复用案例为核心,构建从基础入门到前沿应用的完整学习体系。 本书共分为4个部分。第一部分为基础入门篇,主要讲解深度学习核心概念、线性回归、神经网络基础及PyTorch框架应用,包含从零实现线性回归模型训练、Logistic回归实战、多项式回归与模型选择等案例。第二部分为计算机视觉模型篇,先介绍CNN的原理,再结合边缘检测、猫狗分类研究(基于VGG16)、验证码识别(基于ResNet)、人脸相似度判断(基于孪生神经网络)、火焰和烟雾目标检测(基于YOLOv12)等实战项目讲解计算机视觉任务。第三部分为自然语言处理模型篇,从循环神经网络到注意力机制与机器翻译,通过微博话题识别、气温预测(基于CNN-LSTM混合模型)、从中文到英文的翻译(基于Seq2Seq与注意力机制)等实战项目,破解序列数据建模难题。第四部分为大模型架构与应用篇,解析Transformer架构,通过小型中文聊天系统与医疗问答大模型定制两大实战项目,介绍开源大模型微调与推理。 本书适合深度学习初学者(含计算机相关专业学生)、AI开发/测试工程师、企业AI技术管理者/运维工程师、科研人员/技术爱好者阅读,既为入门者搭建系统知识框架,也为资深从业者提供项目落地参考,助力快速掌握深度学习工程化核心技能。

图书摘要

相关图书

Agent设计模式 图解可复用智能体架构
Agent设计模式 图解可复用智能体架构
Skills+OpenClaw:从零打造个性化AI助理
Skills+OpenClaw:从零打造个性化AI助理
AI Agent 开发实战:MCP+A2A+LangGraph 驱动的智能体全流程开发
AI Agent 开发实战:MCP+A2A+LangGraph 驱动的智能体全流程开发
Coze入门:7天玩转扣子智能体
Coze入门:7天玩转扣子智能体
十倍速开发:AI时代的Cursor编程手记
十倍速开发:AI时代的Cursor编程手记
计算流体力学大串讲轻松解锁CFD     从公式到代码的奇妙之旅
计算流体力学大串讲轻松解锁CFD 从公式到代码的奇妙之旅

相关文章

相关课程