图书目录:
第1章 绪论 1
1.1 水下图像识别与处理 1
1.2 水下声呐图像处理技术 3
1.3 本书安排 5
第2章 声呐数据预处理与数据集制作 7
2.1 引言 7
2.2 前视声呐介绍 7
2.2.1 前视声呐成像原理 7
2.2.2 Oculus前视声呐 9
2.2.3 Oculus数据 12
2.3 前视声呐数据预处理 15
2.3.1 坐标变换 15
2.3.2 图像插值 17
2.4 前视声呐数据采集与图像标注 20
2.4.1 前视声呐数据采集 20
2.4.2 前视声呐图像标注 21
2.5 本章小结 23
第3章 声呐图像目标检测和图像去噪算法的技术现状 24
3.1 引言 24
3.2 声呐目标检测算法的技术现状 25
3.2.1 基于人工特征的声呐图像目标检测算法 25
3.2.2 基于传统机器学习的声呐图像目标检测算法 26
3.2.3 基于深度学习的声呐图像目标检测算法 27
3.3 声呐图像去噪算法的技术现状 29
3.3.1 基于滤波器的声呐图像去噪算法 30
3.3.2 基于深度学习的声呐图像去噪算法 31
3.4 本章小结 33
第4章 基于深度学习的前视声呐图像目标检测算法 35
4.1 引言 35
4.2 基于STAFNet模型的目标检测算法 36
4.2.1 STAFNet模型组成概述 36
4.2.2 主干网络Swin Transformer 38
4.2.3 颈部网络FPN 43
4.2.4 轻量级检测器Lite Head 43
4.2.5 三元损失函数 45
4.3 实验与结果分析 47
4.3.1 实验细节 47
4.3.2 评价指标 48
4.3.3 消融实验 49
4.3.4 对比实验 49
4.3.5 结果分析 51
4.4 本章小结 52
第5章 基于深度学习的前视声呐图像去噪算法 53
5.1 引言 53
5.2 前视声呐图像噪声模型 54
5.3 RAT算法 55
5.4 基于Pix2Pix的改进版RAT算法 58
5.4.1 Pix2Pix模型结构 58
5.4.2 PBR算法 61
5.5 实验与结果分析 66
5.5.1 评价指标 66
5.5.2 对比实验 69
5.5.3 结果分析 69
5.6 本章小结 71
第6章 前视声呐图像语义分割方法 72
6.1 引言 72
6.2 前视声呐图像语义分割方法研究现状 73
6.3 基于深度学习的图像语义分割方法研究现状 74
6.4 前视声呐图像语义分割难点 76
6.5 本章小结 78
第7章 前视声呐图像语义分割数据集构建 79
7.1 引言 79
7.2 前视声呐成像原理 80
7.3 数据采集与数据集划分 83
7.3.1 数据采集 83
7.3.2 数据集划分 85
7.4 数据扩增 85
7.4.1 仿射变换 86
7.4.2 颜色调整 87
7.5 语义分割数据集标签制作 88
7.6 本章小结 89
第8章 基于残差多级特征提取与融合的语义分割方法 91
8.1 引言 91
8.2 卷积神经网络基础 92
8.2.1 卷积层 92
8.2.2 池化层 95
8.2.3 激活层 95
8.2.4 标准化层 98
8.2.5 丢弃层 99
8.3 多级注意力与空洞金字塔嵌套U形网络 100
8.3.1 残差U形特征提取结构 100
8.3.2 注意力与空洞金字塔特征融合结构 102
8.3.3 损失函数 105
8.4 实验与结果分析 106
8.4.1 实验评价指标 106
8.4.2 实验设置与训练过程分析 108
8.4.3 消融实验与结果分析 110
8.4.4 对比实验与结果分析 112
8.5 本章小结 116
第9章 基于Transformer和CNN的语义分割方法 118
9.1 引言 118
9.2 Transformer基础 118
9.2.1 自注意力机制 119
9.2.2 多头自注意力机制 120
9.2.3 位置编码 121
9.3 融合Transformer和CNN的U形网络 121
9.3.1 混合Transformer嵌入编码结构 122
9.3.2 混合Transformer扩张解码结构 124
9.4 实验与结果分析 126
9.4.1 实验评价指标 126
9.4.2 参数设置与训练过程分析 127
9.4.3 消融实验与结果分析 129
9.4.4 对比实验与结果分析 130
9.4.5 泛化实验与结果分析 132
9.5 本章小结 133
第10章 声呐图像长尾小样本数据研究概述 135
10.1 引言 135
10.2 长尾小样本研究的难点 136
10.3 本书关注的挑战 138
10.4 本书作者团队的主要贡献 140
10.5 本章小结 143
第11章 声呐图像开放集长尾识别研究概述 144
11.1 引言 144
11.2 声呐图像识别研究现状 144
11.3 长尾识别研究现状 145
11.4 开放集识别研究现状 146
11.5 开放集长尾识别研究现状 147
11.6 分布外检测研究现状 148
11.7 本章小结 148
第12章 声呐图像长尾小样本识别方法 149
12.1 引言 149
12.2 类别重平衡策略对迁移学习的影响 149
12.3 平衡集成迁移学习方法 151
12.3.1 问题定义与方法动机 151
12.3.2 整体框架 153
12.3.3 主要模块介绍 154
12.3.4 BETL的训练算法 157
12.4 实验与结果分析 158
12.4.1 评价指标 158
12.4.2 数据集描述 160
12.4.3 实验环境和参数设置 161
12.4.4 与先进方法的对比 162
12.4.5 结果分析 163
12.5 本章小结 181
第13章 声呐图像开放集长尾识别方法 183
13.1 引言 183
13.2 构建声呐图像开放集长尾识别基准 184
13.2.1 Sonar-OLTR任务的形式化定义 184
13.2.2 一种简化形式的开放度定义的合理性讨论 185
13.2.3 数据集的选择和构建 187
13.2.4 声呐图像中的开放集识别所面临的挑战 189
13.2.5 设定评价指标 192
13.2.6 Sonar-OLTR实验设计 196
13.3 PLUD方法 196
13.3.1 提出方法的动机 196
13.3.2 整体框架 201
13.3.3 主要模块 202
13.3.4 和现有方法的联系 205
13.4 实验与结果分析 205
13.4.1 实现细节 205
13.4.2 和先进方法的对比 206
13.4.3 主要结果和分析 208
13.4.4 分布外检测 214
13.4.5 消融实验 217
13.4.6 超参数分析 218
13.4.7 进一步分析本书提出的评价指标 220
13.5 本章小结 223
附录A Oculus格式数据结构表 224
附录B 本书部分变量表 227
附录C 本书涉及的主要算法术语及其对应描述 229
推荐阅读 231
详情
随着海洋开发活动的增多和相关研究的不断深入,水下声呐图像处理技术的应用日益广泛。水下声呐图像处理是人工智能与海洋探测领域中的热门研究课题,同时也是相关专业的一门核心课程。
本书包括13章。第1章为绪论,介绍水下图像识别与处理的背景知识及水下声呐图像处理技术的基本概念和发展现状。第2章讲解声呐数据预处理与数据集制作,涵盖设备介绍、数据获取及预处理步骤等。第3章介绍声呐图像目标检测和去噪算法。第4和5章分别探究基于深度学习的前视声呐图像目标检测算法和去噪算法。第6章聚焦前视声呐图像语义分割方法。第7章介绍前视声呐图像语义分割数据集的构建。第8章介绍基于残差多级特征提取与融合的语义分割方法。第9章介绍基于Transformer和CNN的语义分割方法。第10~13章集中攻克长尾小样本声呐数据识别难题。此外,本书还通过附录提供一系列补充知识,通过推荐阅读分享一些值得参考的资料。
本书面向海洋探测领域的科研人员、工程师及高校师生,旨在帮助他们掌握人工智能技术在该领域的应用和实践。