基于深度学习的表单识别系统的研究与实现
发布时间:2021-02-25 16:34
表单以纸质或数字(电子)形式存在于人们的日常生活中。纸质表单文件易于阅读和分享,数字则易于索引与保存。为了进行更有效的知识管理,通常需要先将纸质表单转换为数字格式,然后再进行表单文字信息的提取。传统的表单数据一般通过手动录入的方式进行信息的统计和分析,随着人工智能,模式识别的研究和发展,人们获取表单信息的方式不再局限于手动录入或扫描仪的方式,而是利用计算机对表单图像进行自动化识别,从而可以大幅度提高工作效率,为人们的生活与办公提供便利。本文通过研究国内外表单识别的发展现状,在深度学习下的卷积神经网络的基础上,展开了对自然条件下表单文档的定位以及特定类型表单上印刷体文字识别的研究。本文主要的研究工作有:(1)基于残差网络的表单定位算法研究针对表单文档定位问题,通过对比本文提出的普通卷积神经网络模型与残差网络模型,选择残差网络来处理表单文档的定位,并将残差网络与扩张卷积、Dropout技术相结合来对表单进行更好地定位。为了使网络模型更具有泛化性,在实验中所包含的文档不止表单,还包括论文、杂志等,则此时对于文档的定位并不依赖于文档的内容本身。本文将表单的定位问题处理为八个特征点的检测问题,即...
【文章来源】:武汉工程大学湖北省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
ReLU激活函数②非线性处理在线性系统中,改变输入通常产生一个成比例的输出,此时的系统
整体流程图如图 3.2 所示。图 3.2 文档定位算法整体流程图3.2.1 实验流程(1)角点检测在本章中,首先使用扩张卷积残差网络来获得四个预测的角点,即TL,TR,BR 和 BL,网络结构如图 3.3 所示。图 3.3 扩张卷积残差网络结构图以“ICDAR 2015 SmartDoc Challenge 1”数据库中样本图为例,提取的四个角点如图 3.4 所示。
图 3.2 文档定位算法整体流程图3.2.1 实验流程(1)角点检测在本章中,首先使用扩张卷积残差网络来获得四个预测的角点,即TL,TR,BR 和 BL,网络结构如图 3.3 所示。
【参考文献】:
期刊论文
[1]基于深度学习的场景文字检测与识别[J]. 白翔,杨明锟,石葆光,廖明辉. 中国科学:信息科学. 2018(05)
[2]基于深度残差网络的脱机手写汉字识别研究[J]. 张帆,张良,刘星,张宇. 计算机测量与控制. 2017(12)
[3]基于Gabor特征和协同神经网络的车牌识别方法[J]. 石贵民,余文森,肖钟捷. 河北大学学报(自然科学版). 2016(02)
[4]基于多尺度梯度及深度神经网络的汉字识别[J]. 潘炜深,金连文,冯子勇. 北京航空航天大学学报. 2015(04)
[5]基于多重卷积神经网络的大模式联机手写文字识别[J]. 葛明涛,王小丽,潘立武. 现代电子技术. 2014(20)
[6]基于ART神经网络的汉字识别[J]. 李龙,戴凤智,于春雨,李玢瑶,张峻霞. 天津科技大学学报. 2013(04)
[7]支持向量机的古汉字识别研究[J]. 孙华,李爱平. 电脑知识与技术. 2013(18)
[8]基于改进BP神经网络的手写字符识别[J]. 许宜申,顾济华,陶智,吴迪,朱明诚. 通信技术. 2011(05)
[9]利用OCR识别技术实现视频中文字的提取[J]. 陈义,李言俊,孙小炜. 计算机工程与应用. 2010(10)
硕士论文
[1]基于Tesseract的电子票据云平台的设计与实现[D]. 王希晨.南京大学 2016
[2]深度学习及其在手写汉字识别中的应用研究[D]. 王有旺.华南理工大学 2014
本文编号:3051246
【文章来源】:武汉工程大学湖北省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
ReLU激活函数②非线性处理在线性系统中,改变输入通常产生一个成比例的输出,此时的系统
整体流程图如图 3.2 所示。图 3.2 文档定位算法整体流程图3.2.1 实验流程(1)角点检测在本章中,首先使用扩张卷积残差网络来获得四个预测的角点,即TL,TR,BR 和 BL,网络结构如图 3.3 所示。图 3.3 扩张卷积残差网络结构图以“ICDAR 2015 SmartDoc Challenge 1”数据库中样本图为例,提取的四个角点如图 3.4 所示。
图 3.2 文档定位算法整体流程图3.2.1 实验流程(1)角点检测在本章中,首先使用扩张卷积残差网络来获得四个预测的角点,即TL,TR,BR 和 BL,网络结构如图 3.3 所示。
【参考文献】:
期刊论文
[1]基于深度学习的场景文字检测与识别[J]. 白翔,杨明锟,石葆光,廖明辉. 中国科学:信息科学. 2018(05)
[2]基于深度残差网络的脱机手写汉字识别研究[J]. 张帆,张良,刘星,张宇. 计算机测量与控制. 2017(12)
[3]基于Gabor特征和协同神经网络的车牌识别方法[J]. 石贵民,余文森,肖钟捷. 河北大学学报(自然科学版). 2016(02)
[4]基于多尺度梯度及深度神经网络的汉字识别[J]. 潘炜深,金连文,冯子勇. 北京航空航天大学学报. 2015(04)
[5]基于多重卷积神经网络的大模式联机手写文字识别[J]. 葛明涛,王小丽,潘立武. 现代电子技术. 2014(20)
[6]基于ART神经网络的汉字识别[J]. 李龙,戴凤智,于春雨,李玢瑶,张峻霞. 天津科技大学学报. 2013(04)
[7]支持向量机的古汉字识别研究[J]. 孙华,李爱平. 电脑知识与技术. 2013(18)
[8]基于改进BP神经网络的手写字符识别[J]. 许宜申,顾济华,陶智,吴迪,朱明诚. 通信技术. 2011(05)
[9]利用OCR识别技术实现视频中文字的提取[J]. 陈义,李言俊,孙小炜. 计算机工程与应用. 2010(10)
硕士论文
[1]基于Tesseract的电子票据云平台的设计与实现[D]. 王希晨.南京大学 2016
[2]深度学习及其在手写汉字识别中的应用研究[D]. 王有旺.华南理工大学 2014
本文编号:3051246
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3051246.html