基于特征融合的端到端车牌检测和识别算法研究
发布时间:2020-11-17 22:27
随着大数据、深度学习、物联网和5G通信技术的飞速发展,以及中国城镇化速度的加快,建设智慧城市已经成为一种趋势。智能交通在智慧城市中扮演着非常重要的角色,其不仅仅能缓解城市交通拥堵问题,还能够提高交通道路的使用效率、节约石油资源和改善生态环境等。另外,交通智能监控系统也具有保护城市的作用,该系统能够帮助公安机关快速跟踪可疑车辆和犯罪嫌疑人,从而让我们所生活的城市变得更加安全。由于车牌号码相当于一辆汽车的“身份证号码”,因此车牌检测和识别算法技术在智能交通系统建设中起着十分重要的作用。传统的车牌检测和识别算法通常在一些简单的场景下能取得良好的识别效果,但是在光照不足、倾斜、模糊和恶劣天气等复杂的场景下,这些传统的方法就不能够准确识别出车牌号码。许多研究者通常把车牌检测和识别过程分成车牌检测和车牌识别两个步骤,或者分为车牌检测、车牌字符分割和车牌字符识别三个步骤。车牌字符识别与前面的车牌检测和车牌字符分割两个步骤是高度相关的,当车牌检测算法预测出错误的车牌边界框时,就会影响后面车牌字符的识别,或者导致后面车牌字符分割错误,最终导致车牌字符识别算法预测出错误的车牌号码。为了解决车牌检测和识别算法存在的问题,本文将基于深度学习的目标检测算法应用到车牌检测和识别方法当中,设计了一种基于特征融合的端到端车牌检测和识别网络模型。该网络模型结构是由车牌特征提取网络、特征融合网络、多尺度特征网络、位置检测器和字符识别器五个部分组成的。在该网络模型中,把不同尺寸的特征图进行融合,目的是用来保存浅层特征图上的车牌位置语义信息,这样做的目的是为了进一步提高车牌位置和字符的识别准确率。与分成多个步骤的车牌检测和识别算法相比,该网络模型能够进行端到端的训练。当输入测试图片时,能够同时输出车牌的边界框和号码,从而避免了分段车牌识别算法所产生的中间误差积累和放大问题。由于该网络模型通过共享基础特征提取网络,减少了网络计算参数,从而显著提高了车牌检测和识别的速度。本文制作了一个车牌数据集用于该网络模型的训练和测试,其中车牌图片都是在复杂场景下收集的。通过与其他算法进行实验对比,证明了该网络模型能够有效提高车牌位置和字符的识别准确率。
【学位单位】:江西财经大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:U495;TP18;TP391.41
【部分图文】:
第2章目标检测和车牌识别相关算法理论研究11图2-2常见一端目标检测算法框架2.1.1FasterR-CNN目标算法分析在2015年,RossGirshick等人提出了一种先进的目标检测算法FasterR-CNN,FasterR-CNN是在FastR-CNN算法基础上改进而来的。FasterR-CNN主要的创新点是解决了FastR-CNN需要先使用选择性搜索算法SS(SelectiveSearch,SS)[25]提取候选框而造成目标检测速度非常慢的问题,FasterR-CNN设计了一种候选区域生成网络(RegionProposalNetwork,RPN)用来取代SS算法,同时让RPN网络和FastR-CNN网络共同使用基础特征提取网络输出的特征图。这种网络设计方法把基础特征提娶候选框生成、目标对象分类和定位都集成到统一的深度神经网络模型中,使网络模型没有重复计算,完全在GPU中完成,不仅速度得到了较大的提高,而且还取得了更加准确的检测结果。FasterR-CNN
基于特征融合的端到端车牌检测和识别算法研究12检测的准确度和速度相比于FastR-CNN算法有了较大的提高,例如,基于ZF网络[36]的FasterR-CNN检测目标对象的速度为17FPS,在PASCALVOC[37]数据集上的准确率为59.9%;基于VGG网络的FasterR-CNN检测目标对象的速度为5FPS,在PASCALVOC数据集上的准确率为78.8%。FasterR-CNN算法的网络结构图如图2-3所示。图2-3FasterR-CNN网络结构图从图2-3中可以观察到,FasterR-CNN算法的深度卷积网络结构图主要分为三大模块,分别是基础特征提取网络、候选区域生成网络和目标分类回归网络。下面将对这三大模块分别进行介绍。基础特征提取网络的目的是提取训练数据中的基础特征,用于后面的目标分类和定位。基础特征提取网络使用一个卷积神经网络得到特征图,然后将特征图分别输入到后面的RPN网络和ROIPooling网络中。其中卷积神经网络不一定非要使用VGG和ZF网络,也可以使用LeNet、AlexNet、GooleNet、ResNet等经典卷积神经网络,因此可以根据自己的实际需求选择合适的卷积神经网络。几种常见的经典卷积神经网络结构图如图2-4所示。
第2章目标检测和车牌识别相关算法理论研究13图2-4经典卷积神经网络结构图候选区域生成网络主要目的是用于生成目标对象的候选框,RPN网络结构示意图如图2-5所示。从图中可以观察到,使用滑动窗口在特征图的每个像素点上进行滑动,每一个像素点会对应产生k个不同尺寸和比例的锚点(anchors),即k个候选框,然后通过分类器判断每一个锚点属于前景(foreground)或者背景(background),即是目标对象或者不是目标对象,通过位置回归器修正锚点从而得到精确的候选框。RPN网络把位置误差和分类误差作为整体误差进行训练,
【参考文献】
本文编号:2887994
【学位单位】:江西财经大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:U495;TP18;TP391.41
【部分图文】:
第2章目标检测和车牌识别相关算法理论研究11图2-2常见一端目标检测算法框架2.1.1FasterR-CNN目标算法分析在2015年,RossGirshick等人提出了一种先进的目标检测算法FasterR-CNN,FasterR-CNN是在FastR-CNN算法基础上改进而来的。FasterR-CNN主要的创新点是解决了FastR-CNN需要先使用选择性搜索算法SS(SelectiveSearch,SS)[25]提取候选框而造成目标检测速度非常慢的问题,FasterR-CNN设计了一种候选区域生成网络(RegionProposalNetwork,RPN)用来取代SS算法,同时让RPN网络和FastR-CNN网络共同使用基础特征提取网络输出的特征图。这种网络设计方法把基础特征提娶候选框生成、目标对象分类和定位都集成到统一的深度神经网络模型中,使网络模型没有重复计算,完全在GPU中完成,不仅速度得到了较大的提高,而且还取得了更加准确的检测结果。FasterR-CNN
基于特征融合的端到端车牌检测和识别算法研究12检测的准确度和速度相比于FastR-CNN算法有了较大的提高,例如,基于ZF网络[36]的FasterR-CNN检测目标对象的速度为17FPS,在PASCALVOC[37]数据集上的准确率为59.9%;基于VGG网络的FasterR-CNN检测目标对象的速度为5FPS,在PASCALVOC数据集上的准确率为78.8%。FasterR-CNN算法的网络结构图如图2-3所示。图2-3FasterR-CNN网络结构图从图2-3中可以观察到,FasterR-CNN算法的深度卷积网络结构图主要分为三大模块,分别是基础特征提取网络、候选区域生成网络和目标分类回归网络。下面将对这三大模块分别进行介绍。基础特征提取网络的目的是提取训练数据中的基础特征,用于后面的目标分类和定位。基础特征提取网络使用一个卷积神经网络得到特征图,然后将特征图分别输入到后面的RPN网络和ROIPooling网络中。其中卷积神经网络不一定非要使用VGG和ZF网络,也可以使用LeNet、AlexNet、GooleNet、ResNet等经典卷积神经网络,因此可以根据自己的实际需求选择合适的卷积神经网络。几种常见的经典卷积神经网络结构图如图2-4所示。
第2章目标检测和车牌识别相关算法理论研究13图2-4经典卷积神经网络结构图候选区域生成网络主要目的是用于生成目标对象的候选框,RPN网络结构示意图如图2-5所示。从图中可以观察到,使用滑动窗口在特征图的每个像素点上进行滑动,每一个像素点会对应产生k个不同尺寸和比例的锚点(anchors),即k个候选框,然后通过分类器判断每一个锚点属于前景(foreground)或者背景(background),即是目标对象或者不是目标对象,通过位置回归器修正锚点从而得到精确的候选框。RPN网络把位置误差和分类误差作为整体误差进行训练,
【参考文献】
相关期刊论文 前4条
1 孙金岭;庞娟;张泽龙;;基于颜色特征和改进Canny算子的车牌图像定位[J];吉林大学学报(理学版);2015年04期
2 马爽;樊养余;雷涛;吴鹏;;一种基于多特征提取的实用车牌识别方法[J];计算机应用研究;2013年11期
3 王洪亚;;基于HSV的夜间车牌识别算法[J];智能计算机与应用;2013年02期
4 张晓娜;何仁;陈士安;姚明;;基于主动学习AdaBoost算法与颜色特征的车牌定位[J];交通运输工程学报;2013年01期
本文编号:2887994
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2887994.html