第 一部分 基础入门篇
第 1章 深度学习基础 2
1.1 AI技术演进 2
1.1.1 什么是AI:核心定义与早期技术范式 2
1.1.2 机器学习:实现AI的关键途径 3
1.1.3 深度学习:机器学习的强大引擎 3
1.1.4 AI、机器学习、深度学习和神经网络的关系 4
1.2 基础工具库与线性回归 5
1.2.1 NumPy和Matplotlib库 5
1.2.2 线性回归模型原理 12
1.2.3 线性回归模型训练要素 23
1.2.4 模型预测介绍 26
1.2.5 实例1:从零实现线性回归模型训练 27
1.3 神经网络基础 29
1.3.1 从生物神经元到人工神经网络 29
1.3.2 线性回归模型的神经网络结构 31
1.3.3 多层神经网络 31
1.3.4 神经网络底层原理 32
1.3.5 隐藏层定义与理解 39
1.3.6 激活函数定义与介绍 41
1.3.7 实例2:构建波士顿房价预测的神经网络模型 44
1.4 小结 55
第 2章 PyTorch框架介绍与应用 56
2.1 PyTorch框架简介 56
2.1.1 PyTorch安装 56
2.1.2 PyTorch的数据结构及其与NumPy的异同 57
2.1.3 PyTorch层和块 60
2.1.4 PyTorch自定义块 61
2.2 实例1:Logistic回归实战(解决异或问题) 62
2.2.1 异或问题分析 62
2.2.2 异或问题代码实现 63
2.2.3 异或模型训练 66
2.3 实例2:多项式回归与模型选择 69
2.3.1 多项式回归的一般形式 69
2.3.2 多项式回归的实现 69
2.3.3 模型选择 79
2.4 小结 79
第二部分 计算机视觉模型篇
第3章 计算机视觉核心模型 81
3.1 CNN介绍 81
3.1.1 全连接网络提取图像特征存在的问题 81
3.1.2 CNN的优势 81
3.2 CNN层级结构 82
3.2.1 输入层 82
3.2.2 卷积层 85
3.2.3 激活层 89
3.2.4 池化层 89
3.2.5 全连接层 90
3.3 CNN常用API介绍 91
3.3.1 PyTorch卷积算子API 91
3.3.2 PyTorch最大池化函数 94
3.3.3 实例1:图像中物体的边缘检测和图像均值模糊 94
3.4 批归一化详解 98
3.4.1 批归一化的作用 98
3.4.2 批归一化与激活函数 99
3.4.3 批归一化数学表达式 100
3.4.4 实现批归一化的计算公式 100
3.4.5 实例2:模型的训练模式和评估模式应用 109
3.5 小结 113
第4章 图像分类实战 114
4.1 实例1:猫狗分类研究 114
4.1.1 数据集准备与预处理 114
4.1.2 VGG16网络模型构建 116
4.1.3 VGG16网络模型训练 118
4.1.4 模型优化与预测 119
4.1.5 基于Grad-CAM的模型可视化 121
4.2 实例2:验证码识别 135
4.2.1 网络深度的重要性 135
4.2.2 残差网络的核心思想与解决方案 136
4.2.3 ResNet系列网络 137
4.2.4 验证码识别数据集预处理 138
4.2.5 基于ResNet-18验证码识别的模型构建 142
4.2.6 ResNet-18模型训练与推理 145
4.3 实例3:人脸相似度判断 147
4.3.1 孪生神经网络简介 147
4.3.2 孪生神经网络的构建与微调 148
4.3.3 标签的生成 151
4.3.4 训练与预测过程 152
4.4 小结 155
第5章 目标检测实战 156
5.1 YOLO系列模型解读 156
5.1.1 YOLOv0简介 156
5.1.2 YOLOv1详解 159
5.1.3 YOLOv2改进解析 172
5.2 实例:火焰和烟雾目标检测 176
5.2.1 项目背景 176
5.2.2 Ultralytics YOLOv12的下载与安装 177
5.2.3 数据集处理 177
5.2.4 训练、测试、推理 181
5.2.5 模型导出 184
5.2.6 小样本低资源场景下的优化策略 184
5.3 工业级模型评估指标解读 197
5.3.1 模型评估核心基础 197
5.3.2 评估指标 198
5.3.3 火焰和烟雾目标检测模型训练结果指标分析 200
5.3.4 工业级指标选择与优化策略 203
5.4 小结 205
第三部分 自然语言处理模型篇
第6章 循环神经网络 207
6.1 RNN介绍 207
6.1.1 为什么需要RNN 207
6.1.2 RNN结构解析 208
6.1.3 RNN单元 209
6.1.4 RNN类 213
6.1.5 实例1:使用RNN单元进行字符学习 216
6.1.6 实例2:使用RNN进行字符学习 222
6.1.7 实例3:用词嵌入改进实例2 225
6.2 LSTM介绍 231
6.2.1 LSTM的设计思考 231
6.2.2 LSTM网络结构 231
6.2.3 手动实现LSTM网络结构 233
6.2.4 直接调用PyTorch的LSTM类接口 236
6.3 小结 239
第7章 序列模型工程应用实战 240
7.1 实例1:微博话题识别 240
7.1.1 微博新闻评论数据集介绍 240
7.1.2 数据分析与可视化 240
7.1.3 项目实现思路 243
7.1.4 加载文本数据 243
7.1.5 LSTM模型搭建和训练 245
7.1.6 模型评价指标 248
7.1.7 模型测试 249
7.2 实例2:气温预测 250
7.2.1 CNN-LSTM的算法原理 250
7.2.2 CNN-LSTM的网络结构设计 251
7.2.3 任务描述 252
7.2.4 获取数据集 252
7.2.5 处理时间数据 252
7.2.6 特征数据可视化 253
7.2.7 数据预处理—时间序列样本 255
7.2.8 构建CNN-LSTM混合时空网络模型 259
7.2.9 模型训练 261
7.2.10 预测阶段 262
7.3 小结 263
第8章 注意力机制与机器翻译实战 264
8.1 Seq2Seq模型快速导读 264
8.1.1 Seq2Seq结构介绍 264
8.1.2 注意力机制的设计原理 266
8.2 实例:从中文到英文的翻译 272
8.2.1 环境配置 272
8.2.2 数据加载 272
8.2.3 构建具有注意力机制的Seq2Seq模型 275
8.2.4 图解注意力机制 279
8.2.5 使用模型进行机器翻译推理 282
8.2.6 扩展:贪心搜索与集束搜索 283
8.3 小结 285
第四部分 大模型架构与应用篇
第9章 Transformer原理与实战 287
9.1 Transformer导读 287
9.2 Transformer结构详解 288
9.2.1 位置编码 288
9.2.2 自注意力机制 296
9.2.3 编码器的多头注意力机制 310
9.2.4 编码器的层归一化 313
9.2.5 编码器的逐位前馈网络 317
9.2.6 编码器构建 319
9.2.7 解码器构建详解 321
9.2.8 Transformer模型完整构建 330
9.3 实例:小型中文聊天系统 331
9.3.1 语料准备 332
9.3.2 构建Transformer模型 333
9.3.3 预训练Transformer模型 334
9.3.4 微调Transformer模型 336
9.4 小结 337
第 10章 开源大模型定制开发实战 339
10.1 开源大模型入门 339
10.1.1 什么是开源大模型 339
10.1.2 大模型任务类型 340
10.2 开发环境搭建 340
10.2.1 开源大模型开发工具链 340
10.2.2 算力平台对比分析 342
10.2.3 本地部署与云平台对比 343
10.2.4 基于Transformers库的开源模型本地部署 343
10.3 实例:端到端医疗问答大模型定制 345
10.3.1 数据准备 345
10.3.2 预训练大模型选型 348
10.3.3 训练参数配置 348
10.3.4 基于LoRA的高效微调技术 349
10.3.5 模型推理应用 352
10.3.6 高效微调技术对比与选型 354
10.3.7 开源模型适配性分析与选型建议 356
10.4 小结 358