自然场景下的文本检测与识别方法研究

发布时间:2021-04-07 04:30
  作为计算机视觉应用的重要分支,自然场景中的文本阅读一直以来都是基于深度学习的计算机视觉领域内最受欢迎的热门研究领域之一,在最近十年被广泛的进行了研究。由许多现实世界的应用所驱动,对于助盲系统、智慧交通系统、无人驾驶导航系统等方向均具有实际应用的现实意义由于场景文本的多样性及背景的复杂性,场景文本检测识别目前面临着很多挑战。在自然场景中阅读文本分为文本检测和文本识别两个过程。其与光学字符识别(OCR)并不完全相似,在检测难度、识别精度需求上还存在很大的差别。尤其是在无人驾驶导航的路标信息提取中,对识别精准度要求极高,OCR技术难以实现高准度识别。目前的场景文本检测及识别方法多为基于深度学习的方法,在面对复杂场景时深度学习具有传统方法不可比拟的泛化能力。本文对自然场景的文本检测与识别进行了深入研究,提出了基于YOLOv3的多向文本检测算法,以及基于CRNN的不定长字符识别方法。本文具体研究内容如下:(1)本文提出了一种场景文本图像预处理方法,同时提出了一个长文本子数据集用于长文本检测,以及一个大规模合成中文字符数据集用于中文字符识别。本文使用了 PCA对图片进行了降维,并提出了改进的中值滤... 

【文章来源】:东北电力大学吉林省

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

自然场景下的文本检测与识别方法研究


图2-1?申备网备训Suig…??由于卷积计算过程在二维空间内完成,包括计算过程的参数、输入输出数据和计算关??

过程图,卷积,过程,卷积核


?(2-3)??其中*表示卷积。??假设是二维的卷积,则表达式为:??^?y)?=?(X?x?^)?(/,?y)?=?(/?-m,j-n)w(m,?n)?(2-4)??m?n??在这个公式中,X为输入,W为卷积核。若输入的X是一个二维矩阵,则w也是一??个二维矩阵。??根据上面的数学卷积过程来对CNN的卷积过程进行理解。图像卷积主要使用卷积层??的卷积核(滤波器)在图像上按从左至右从上至下的顺序进行滑动,卷积核参数与对应图片??的像素值进行相乘运算后再相加。卷积过程示意图如图2-3所示,输入数据是二维3X3矩??阵,其9个值为图像像素值矩阵,采用2X2的卷积核对图像进行计算。右侧图为最终输出??的卷积后的由4个像素构成的特征图。最终卷积值为aw?+?6x?+办+?ez、+?+?+声、??i/vv?+?ex?+?gy?+?Zzz、£w+_y5c?+?/^?+?/z。实际运算中,为了避免丢失边缘信息,会在外层补上一??圈0后再进行卷积,此过程称为padding。同时,为了实现不同的网络功能,卷积的步长可??以为任意值,通常使用步长为1进行特征提取,使用步长为2进行下采样。??Da?9^?c?????Ed?|e?f?=>?mmj^L????dw+ex.?ew+fx+??gy+h??hy+iz??g?h?i?L.--」??图2-3卷积计算过程??2.?2.?2池化层??与卷积层的复杂度相比,池化层要简单得多。池化的主要目的是进一步减少卷积后参??数的数据量,即降维。具体过程如下:对于mxm矩阵数据,使用nxn矩阵用于池化过滤,??从而可以获得矩阵,从而可以减少输入矩阵的维数。??n?n??若要将

过滤器图,全连接,特征向量,降维


第2章相关理论介绍??4?〇??Mil?q?剛??6?0?6?5?4?4??7?3?14??a)平均池化??T7^??■V??j?: ̄—■-■——i?????6?0?6?5?7?6??7?3?14??b)最大池化??图2-4池化过程??2.?2.?3全连接层??阁像数据经过了卷积操作后提取到了有效的特征向量,再利用池化过滤器对特征提取??到的特征向量数据进行降维,以减少计算的参数暈。卷积和池化后由全连接层对特征向量??进行融合,全连接的结构示意阁如阁2-5所示,前一层的所有神经元均与后??层的所有祌??经元进行连接,运算后得到输出结果的特征表达,输出的最后一层使用激活函数实现对于??文本的分类。??_??图2-5全连接层结构示意图??-9?-??

【参考文献】:
期刊论文
[1]基于卷积神经网络的数字识别[J]. 代贺,陈洪密,李志申.  贵州师范大学学报(自然科学版). 2017(05)
[2]利用SVM的聚类算法在时间序列信号识别中的应用[J]. 汪永涛.  微电子学与计算机. 2012(03)
[3]基于结构特征和灰度特征的车牌字符识别方法[J]. 罗辉武,唐远炎,王翊,蓝利君.  计算机科学. 2011(11)
[4]基于卷积神经网络LeNet-5的车牌字符识别研究[J]. 赵志宏,杨绍普,马增强.  系统仿真学报. 2010(03)
[5]基于小波的车牌汉字特征提取[J]. 潘翔,叶修梓,张三元.  中国图象图形学报. 2003(10)
[6]基于笔划和笔顺的汉字识别算法[J]. 陈治平,林亚平,李军义.  湖南大学学报(自然科学版). 2000(04)

硕士论文
[1]自然场景图像中的文本定位和提取算法研究[D]. 熊玲.东南大学 2016
[2]基于卷积神经网络的联机手写汉字识别系统[D]. 刘欣.哈尔滨工业大学 2015
[3]基于卷积神经网络的深度学习算法与应用研究[D]. 陈先昌.浙江工商大学 2014
[4]基于图像匹配的汉字识别系统研究与实现[D]. 武桐.上海交通大学 2010
[5]基于整体纹理分析的汉字字体识别[D]. 许春晔.河北大学 2001



本文编号:3122803

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3122803.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e020c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com