基于卷积神经网络的名片识别研究
发布时间:2021-10-05 09:04
光学字符识别(OCR)目前在证件识别以及文档识别上有广泛的应用,通过将文字的图片数字化,从中快速提取出有用信息。传统的光学字符识别算法大多依赖于人工设计特征,通过模板匹配的方法实现特定场景的识别,因此,适用场景比较单一,泛化能力较差,处理名片识别的任务时效果不佳。此外,在处理文字间存在噪声干扰的图像上,传统的卷积递归神经网络(CRNN)的检测效果也不理想。因此针对上述问题,文本重点研究了基于深度学习的OCR名片识别从而弥补传统识别系统的不足。本文从信息提取的角度出发,利用OCR技术识别名片信息,进而将名片信息电子化,实现名片数据的结构化存储。基于传统方法以及当今主流方法的分析,文本进行了适当的改进与优化,实现了一种全新的基于卷积神经网络的OCR识别系统。在图像预处理方面,本文设计了一套针对于名片图像的预处理流程,如边缘检测,倾斜矫正等,以消除图片干扰因素的影响,并且,针对相机抖动造成的图像模糊情况,本文提出并实现了一种基于编码器/解码器网络的去模糊模型,以提高后续字符识别的效果;在文本区域检测方面,本文提出并实现了针对名片识别的文本区域检测方法,基于YOLO网络,使用固定宽度的文本图像...
【文章来源】:武汉邮电科学研究院湖北省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
Sobel与Canny算子边缘提取效果对比
武汉邮电科学研究院硕士学位论文13xyo图2-4Hesse法线式图这样,欧式空间中的某个固定点(a,b)就转换为霍夫空间中的一组参数(r,θ),将得到一条正弦曲线,如图2-5所示。图2-5霍夫空间变换对于欧式空间中同一条直线上的多个点,经过变换在霍夫空间中,将相交于同一个点,称此点为峰值点,如图2-6所示。这样,就可以通过检测霍夫空间下的峰值,从而完成直线的检测。图2-6霍夫变换示意图对于名片图像而言,通过上文的边缘检测和Hough变换,就可以得到名片4条边的直线,从而计算出名片4个顶点的坐标,这样就得到了图像中名片的位置信息。接下来,就可以通过透视变换将提取顶点的图像矫正为标准的正视矩形。透视变换是将图片投影到一个新的视平面,其原理是把二维转到三维,进行变换后,再转映射之前的二维空间。如图2-7所示,左侧是发生形变的图像,右侧是经过矫正后的输出图像。
武汉邮电科学研究院硕士学位论文13xyo图2-4Hesse法线式图这样,欧式空间中的某个固定点(a,b)就转换为霍夫空间中的一组参数(r,θ),将得到一条正弦曲线,如图2-5所示。图2-5霍夫空间变换对于欧式空间中同一条直线上的多个点,经过变换在霍夫空间中,将相交于同一个点,称此点为峰值点,如图2-6所示。这样,就可以通过检测霍夫空间下的峰值,从而完成直线的检测。图2-6霍夫变换示意图对于名片图像而言,通过上文的边缘检测和Hough变换,就可以得到名片4条边的直线,从而计算出名片4个顶点的坐标,这样就得到了图像中名片的位置信息。接下来,就可以通过透视变换将提取顶点的图像矫正为标准的正视矩形。透视变换是将图片投影到一个新的视平面,其原理是把二维转到三维,进行变换后,再转映射之前的二维空间。如图2-7所示,左侧是发生形变的图像,右侧是经过矫正后的输出图像。
【参考文献】:
期刊论文
[1]智能视频监控技术综述[J]. 黄凯奇,陈晓棠,康运锋,谭铁牛. 计算机学报. 2015(06)
[2]新的桶形畸变的点阵样板校正方法[J]. 吴开兴,段马丽. 计算机应用. 2012(04)
[3]一种完整的汉字识别系统设计[J]. 印月,黄山. 微计算机信息. 2009(13)
[4]基于多信息融合的中文手写地址字符串切分与识别[J]. 付强,丁晓青,蒋焰. 电子与信息学报. 2008(12)
硕士论文
[1]基于深度学习的自然场景图像文本检测[D]. 黄家冕.西安电子科技大学 2018
[2]深度卷积神经网络在OCR问题中的应用研究[D]. 汪一文.电子科技大学 2018
[3]基于拍照的端到端银行卡卡号检测与识别研究[D]. 金昌军.华中科技大学 2017
[4]基于结构特征点的字符分割技术的研究[D]. 张爱娟.西安电子科技大学 2014
[5]面向人脸识别的特征定位及几何校正研究[D]. 孔海东.河北工业大学 2006
本文编号:3419424
【文章来源】:武汉邮电科学研究院湖北省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
Sobel与Canny算子边缘提取效果对比
武汉邮电科学研究院硕士学位论文13xyo图2-4Hesse法线式图这样,欧式空间中的某个固定点(a,b)就转换为霍夫空间中的一组参数(r,θ),将得到一条正弦曲线,如图2-5所示。图2-5霍夫空间变换对于欧式空间中同一条直线上的多个点,经过变换在霍夫空间中,将相交于同一个点,称此点为峰值点,如图2-6所示。这样,就可以通过检测霍夫空间下的峰值,从而完成直线的检测。图2-6霍夫变换示意图对于名片图像而言,通过上文的边缘检测和Hough变换,就可以得到名片4条边的直线,从而计算出名片4个顶点的坐标,这样就得到了图像中名片的位置信息。接下来,就可以通过透视变换将提取顶点的图像矫正为标准的正视矩形。透视变换是将图片投影到一个新的视平面,其原理是把二维转到三维,进行变换后,再转映射之前的二维空间。如图2-7所示,左侧是发生形变的图像,右侧是经过矫正后的输出图像。
武汉邮电科学研究院硕士学位论文13xyo图2-4Hesse法线式图这样,欧式空间中的某个固定点(a,b)就转换为霍夫空间中的一组参数(r,θ),将得到一条正弦曲线,如图2-5所示。图2-5霍夫空间变换对于欧式空间中同一条直线上的多个点,经过变换在霍夫空间中,将相交于同一个点,称此点为峰值点,如图2-6所示。这样,就可以通过检测霍夫空间下的峰值,从而完成直线的检测。图2-6霍夫变换示意图对于名片图像而言,通过上文的边缘检测和Hough变换,就可以得到名片4条边的直线,从而计算出名片4个顶点的坐标,这样就得到了图像中名片的位置信息。接下来,就可以通过透视变换将提取顶点的图像矫正为标准的正视矩形。透视变换是将图片投影到一个新的视平面,其原理是把二维转到三维,进行变换后,再转映射之前的二维空间。如图2-7所示,左侧是发生形变的图像,右侧是经过矫正后的输出图像。
【参考文献】:
期刊论文
[1]智能视频监控技术综述[J]. 黄凯奇,陈晓棠,康运锋,谭铁牛. 计算机学报. 2015(06)
[2]新的桶形畸变的点阵样板校正方法[J]. 吴开兴,段马丽. 计算机应用. 2012(04)
[3]一种完整的汉字识别系统设计[J]. 印月,黄山. 微计算机信息. 2009(13)
[4]基于多信息融合的中文手写地址字符串切分与识别[J]. 付强,丁晓青,蒋焰. 电子与信息学报. 2008(12)
硕士论文
[1]基于深度学习的自然场景图像文本检测[D]. 黄家冕.西安电子科技大学 2018
[2]深度卷积神经网络在OCR问题中的应用研究[D]. 汪一文.电子科技大学 2018
[3]基于拍照的端到端银行卡卡号检测与识别研究[D]. 金昌军.华中科技大学 2017
[4]基于结构特征点的字符分割技术的研究[D]. 张爱娟.西安电子科技大学 2014
[5]面向人脸识别的特征定位及几何校正研究[D]. 孔海东.河北工业大学 2006
本文编号:3419424
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3419424.html