目 录
第 1章 绪论 1
1.1研究背景 1
1.2 问题与挑战 3
1.3主要研究内容 5
1.4 本文的组织结构 5
第 2章 场景文本检测算法综述 7
2.1简介 7
2.2场景文本检测和识别过程概述 8
2.3场景文本检测和识别算法分类 10
2.3.1基于传统机器学习的场景文本检测和识别算法 10
2.3.2基于深度学习的场景文本检测和识别算法 28
2.4文本检测和识别的评价指标 41
2.5文本检测和识别的数据集 42
2.5.1 ICDAR数据集 42
2.5.2 SVT数据集 44
2.5.3 IIIT数据集 45
2.5.4 KAIST数据集 46
2.5.5 CTW数据集 46
2.5.6 RCTW-17数据集 47
2.5.7 ICPR MWI 2018数据集 48
2.5.8 Total-Text数据集 48
2.5.9 Google FSNS数据集 49
2.5.10 COCO-TEXT数据集 49
2.5.11 Synthetic数据集 50
2.6 总结 50
第3章 基于融合网络的TSFnet模型 52
3.1 问题形成 52
3.2 相关研究 52
3.2.1基于回归的模型 53
3.2.2 基于分割的模型 53
3.3 TSFnet 54
3.4实验 60
3.4.1评价指标 60
3.4.2 参数设置 60
3.4.3 结果与分析 61
3.5 本章小结 64
第4章 结合区域建议网络与注意力网络的Mnet算法 66
4.1 问题形成 66
4.2 相关研究 66
4.2.1基于回归的模型 66
4.2.2 基于分割的模型 67
4.2.3 两阶段检测模型 67
4.3 Mnet 68
4.3.1 Scale-RPN 69
4.3.2回归网络 70
4.3.3 分割网络 70
4.3.4 注意力网络 71
4.4 实验 72
4.4.1评价指标 72
4.4.2参数设置 72
4.4.3实验对比与分析 73
4.5 本章小结 75
第5章 场景文本检测与识别应用 77
5.1卡证文字检测与识别 77
5.1.1证件文字检测与识别 77
5.1.2 银行卡文字检测与识别 79
5.1.3 名片文字检测与识别 79
5.1.4 营业执照文字检测与识别 80
5.2票据文字检测与识别 80
5.3汽车场景文字检测与识别 81
5.3.1 车牌检测与识别 81
5.3.2 汽车VIN码检测与识别 83
5.4 文档文字检测与识别 83
5.5 自然场景文字检测识别 84
第6章 总结与展望 86
6.1 总结 86
6.2展望 86
参考文献 88