自然街景下的文本目标检测和识别方法研究
发布时间:2020-12-03 12:43
处于自然街景下的人获取信息的方式,在于其五种自然感官和先天条件下的自身感知。其中,视觉对于自然街景中的信息处理尤为关键,而在视力所及的众多信息中,最为直观且最易被理解的要数文本信息。科技的进步,促使文本目标检测和识别技术越来越发达。本文以自然街景为研究背景,开展复杂场景下文本目标检测和识别研究。分析了分段式的传统文本检测识别方法。针对现有技术用于小文本目标检测和识别时的不足,提出自然街景下的小文本目标优化方法。针对小文本标注数据较少、手动标记工作量大、效率低的问题,提出了一种半监督的学习算法。主要研究工作如下:1)研究了自然街景下的小文本目标优化方法。构建用于小文本目标检测和识别的三级训练数据集,并设计了一种由易到难的强化训练模型。提出了一种文本目标图像DCT系数合成法,用以合成前两级训练数据集。针对现有技术在处理小目标文本时的不足,提出基于分辨率补偿的小文本目标优化方法,并通过实验验证了优化方法的有效性。2)提出一种半监督的文本目标检测和识别算法。算法采用文本目标检测网络与识别网络并联的架构,并通过预处理与特征提取环节共用,确保文本目标的检测和识别可以共享特征:从而使得文本目标识别的...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
图1-2文本目标检测和识别技术的应用场景??
纹理滑动窗的检测方法[13—15]??和基于连通域的检测方法[16#。近几年中,深度学习技术芷如雨后春舆般茁壮成??长,基于此项技术的文本目标检测算法[2()]也在不断改进更新。其中,较为先进的??方法包括[21-23]?:?Proposal-based?(基于候选框)的文本貝标检测方法、??Segmentation-based?(暴于.分割)的文本_标检测方法、.Hybrid-based【難于"商者混??合)的文本目标检测方法和其它的文本目标检测方法。??基于候选框的文本目标检测如图1-3所示是基于深度学习物体识别中,最为常??见的方法之一。其中,最经典的文本目标检测网络是:基于Faster?RCNN、基于??SSD和基于RFCN的文本目标检测网絡[2?6]。??l?At?^??1、输入待测图片?2、生成彳吳选X本框?3、特征提取?4、特征分类??图1-3碁于候选框的文本肩标检测??对乎一张输入的待检测图像,先是利用若宁个anchor?(锚点)以选择性搜索??的方式产生大量的候选窗G,再经过一个卷积神经网络将候选窗U中的卷积特征??提取出来,特征在通过支持向量机分类器之后会得到一个对应窗H的分数,将分??类准确率低的区块舍去就能够获取较好的检测结果。??Ren等提出的Faster?RCNN文本目标检测网络依赖的是区域建议算法。论文??中提出的方法引入了区域提议网络,该网络与目标检测网络共享了整个图像的卷??积特性,由此可以得到区域建议候选框。接着,利用分类层将候选框中是文本的??5??
?电子科技大学硕士學位诱文???该方法使用初始宇符提取和识别结果来估计布局,之后再执行字符提取和识别操??作。该方法的优越性就体现在:通过增加可靠的估计来增加字符识别精度,从而??提痛'单词识别性能。??在这一节中,我们主要介绍的文本目标识别模型有:CRNN加CTC文本目标??识别网络和RARE文本目标识别网络。??CRNN?加?CTC?(Connectionist?Temporal?Classification)文本貝标识另!]网络(如??图1-5所示)由Shi等【_提出,网络结构可分为卷积网络层、循环网络层和CTC??,层.。??"Everything?is?going?to?be?alright"?输出文本??二…一?Everything?i?s?(?o?i?n?|?to?b?e?alright?CTC?层??循环网络层??????????卜:》I?細网络层??L.??? ̄ ̄I??图1-5?CRNN加CTC文本巨标识别??在CRNN加CTC网络结构中,卷积网络层采用的CNN网络属于暈基本的卷??积层构造。假设我们将一个高度为32、宽度为W、通道数为3的图像作为原始图??像输入,那么在经过卷积网络层之后,我们便会得到一个(1,妒/4,512)的卷积特??征矩阵。循环网络层再将(1,妒/4,512)的卷积特征矩阵作为输入,并将该卷积特??征矩阵中的文字序列特征提取出来。CTC层为了处理训练时字符无法对齐的问题,??采取了不需要对齐的损失函数计算方法。CRNN加CTC文字识别总体来说是一个??端到端的图片文字识别算法,也是在文字识别过程中最常用到的一种网络模型结??构。??RARE?(Ro
【参考文献】:
期刊论文
[1]智慧校园的综合安防系统设计[J]. 陶英. 智能建筑与智慧城市. 2018(05)
[2]基于色彩空间的最大稳定极值区域的自然场景文本检测[J]. 范一华,邓德祥,颜佳. 计算机应用. 2018(01)
[3]基于连通分量特征的文本检测与分割[J]. 蒋人杰,戚飞虎,徐立,吴国荣. 中国图象图形学报. 2006(11)
[4]基于多帧图像的视频文字跟踪和分割算法[J]. 密聪杰,刘洋,薛向阳. 计算机研究与发展. 2006(09)
[5]信息高速公路与计算机技术[J]. 王惠通,李经纬. 电子科技导报. 1994(04)
博士论文
[1]多智能体深度强化学习方法及应用研究[D]. 张悦.西安电子科技大学 2018
[2]基于图的半监督学习及其应用研究[D]. 潘俊.浙江大学 2011
[3]半监督学习及其应用研究[D]. 孔怡青.江南大学 2009
硕士论文
[1]基于深度学习的文本检测识别算法研究及应用[D]. 岑冠东.广东工业大学 2019
[2]基于深度学习的自然场景中文本检测方法研究[D]. 王大千.延边大学 2019
[3]基于机器学习的目标识别方法研究[D]. 常镶石.沈阳理工大学 2019
[4]基于OCR技术的通用证件识别系统[D]. 常参参.南昌大学 2018
[5]基于Tesseract_OCR的驾驶证识别系统设计与实现[D]. 李亮.电子科技大学 2018
[6]基于强化学习的特征选择算法研究[D]. 赵凯旋.重庆交通大学 2018
[7]支票扫描图像中的字符识别算法及实现[D]. 张瑜.哈尔滨工业大学 2016
[8]基于改进HOG特征的行人检测算法研究[D]. 贾楚.燕山大学 2016
[9]基于OCR快递单据识别的研究与实现[D]. 胡提坤.内蒙古大学 2014
本文编号:2896345
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
图1-2文本目标检测和识别技术的应用场景??
纹理滑动窗的检测方法[13—15]??和基于连通域的检测方法[16#。近几年中,深度学习技术芷如雨后春舆般茁壮成??长,基于此项技术的文本目标检测算法[2()]也在不断改进更新。其中,较为先进的??方法包括[21-23]?:?Proposal-based?(基于候选框)的文本貝标检测方法、??Segmentation-based?(暴于.分割)的文本_标检测方法、.Hybrid-based【難于"商者混??合)的文本目标检测方法和其它的文本目标检测方法。??基于候选框的文本目标检测如图1-3所示是基于深度学习物体识别中,最为常??见的方法之一。其中,最经典的文本目标检测网络是:基于Faster?RCNN、基于??SSD和基于RFCN的文本目标检测网絡[2?6]。??l?At?^??1、输入待测图片?2、生成彳吳选X本框?3、特征提取?4、特征分类??图1-3碁于候选框的文本肩标检测??对乎一张输入的待检测图像,先是利用若宁个anchor?(锚点)以选择性搜索??的方式产生大量的候选窗G,再经过一个卷积神经网络将候选窗U中的卷积特征??提取出来,特征在通过支持向量机分类器之后会得到一个对应窗H的分数,将分??类准确率低的区块舍去就能够获取较好的检测结果。??Ren等提出的Faster?RCNN文本目标检测网络依赖的是区域建议算法。论文??中提出的方法引入了区域提议网络,该网络与目标检测网络共享了整个图像的卷??积特性,由此可以得到区域建议候选框。接着,利用分类层将候选框中是文本的??5??
?电子科技大学硕士學位诱文???该方法使用初始宇符提取和识别结果来估计布局,之后再执行字符提取和识别操??作。该方法的优越性就体现在:通过增加可靠的估计来增加字符识别精度,从而??提痛'单词识别性能。??在这一节中,我们主要介绍的文本目标识别模型有:CRNN加CTC文本目标??识别网络和RARE文本目标识别网络。??CRNN?加?CTC?(Connectionist?Temporal?Classification)文本貝标识另!]网络(如??图1-5所示)由Shi等【_提出,网络结构可分为卷积网络层、循环网络层和CTC??,层.。??"Everything?is?going?to?be?alright"?输出文本??二…一?Everything?i?s?(?o?i?n?|?to?b?e?alright?CTC?层??循环网络层??????????卜:》I?細网络层??L.??? ̄ ̄I??图1-5?CRNN加CTC文本巨标识别??在CRNN加CTC网络结构中,卷积网络层采用的CNN网络属于暈基本的卷??积层构造。假设我们将一个高度为32、宽度为W、通道数为3的图像作为原始图??像输入,那么在经过卷积网络层之后,我们便会得到一个(1,妒/4,512)的卷积特??征矩阵。循环网络层再将(1,妒/4,512)的卷积特征矩阵作为输入,并将该卷积特??征矩阵中的文字序列特征提取出来。CTC层为了处理训练时字符无法对齐的问题,??采取了不需要对齐的损失函数计算方法。CRNN加CTC文字识别总体来说是一个??端到端的图片文字识别算法,也是在文字识别过程中最常用到的一种网络模型结??构。??RARE?(Ro
【参考文献】:
期刊论文
[1]智慧校园的综合安防系统设计[J]. 陶英. 智能建筑与智慧城市. 2018(05)
[2]基于色彩空间的最大稳定极值区域的自然场景文本检测[J]. 范一华,邓德祥,颜佳. 计算机应用. 2018(01)
[3]基于连通分量特征的文本检测与分割[J]. 蒋人杰,戚飞虎,徐立,吴国荣. 中国图象图形学报. 2006(11)
[4]基于多帧图像的视频文字跟踪和分割算法[J]. 密聪杰,刘洋,薛向阳. 计算机研究与发展. 2006(09)
[5]信息高速公路与计算机技术[J]. 王惠通,李经纬. 电子科技导报. 1994(04)
博士论文
[1]多智能体深度强化学习方法及应用研究[D]. 张悦.西安电子科技大学 2018
[2]基于图的半监督学习及其应用研究[D]. 潘俊.浙江大学 2011
[3]半监督学习及其应用研究[D]. 孔怡青.江南大学 2009
硕士论文
[1]基于深度学习的文本检测识别算法研究及应用[D]. 岑冠东.广东工业大学 2019
[2]基于深度学习的自然场景中文本检测方法研究[D]. 王大千.延边大学 2019
[3]基于机器学习的目标识别方法研究[D]. 常镶石.沈阳理工大学 2019
[4]基于OCR技术的通用证件识别系统[D]. 常参参.南昌大学 2018
[5]基于Tesseract_OCR的驾驶证识别系统设计与实现[D]. 李亮.电子科技大学 2018
[6]基于强化学习的特征选择算法研究[D]. 赵凯旋.重庆交通大学 2018
[7]支票扫描图像中的字符识别算法及实现[D]. 张瑜.哈尔滨工业大学 2016
[8]基于改进HOG特征的行人检测算法研究[D]. 贾楚.燕山大学 2016
[9]基于OCR快递单据识别的研究与实现[D]. 胡提坤.内蒙古大学 2014
本文编号:2896345
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2896345.html