向中文试卷的手写字符识别关键技术研究与实现
发布时间:2021-06-21 07:51
手写字符识别是指将图片中所展示的图片文字转换为计算机可编辑的文本文字。运用计算机技术实现对手写字符的识别对于保存和利用文字信息具有重要的意义。由于试卷中字符类别的多样性、手写汉字字符结构的复杂性、考生字体的不一致性以及教育问题的严谨性,面向教育领域的手写字符识别具有更高的识别准确率要求。目前,基于深度学习的字符识别技术取得了不错的发展,但针对于教育领域的手写字符研究还处于起步阶段。本文旨在借助于深度学习研究和实现面向中文试卷的手写字符识别关键技术,实现答题卡内容的数字化存储和利用,促进智能化阅卷的过程,进一步推动教育事业面向智能化发展。针对考试场景对识别准确率较高的要求,本文主要采用单字识别模型。在对答题卡字符进行切分的基础上设计了多个不同的卷积网络模型,主要包括手写数字识别模型、手写汉字字符识别模型,最终在两个真实考试场景测试数据集3768类字符上实现了较高的识别准确率。论文的主要工作有:(1)针对单字识别中的分割问题,研究和实现了面向试卷的手写汉字字符切分,设计基于投影的动态行分割,采用局部最小搜索算法寻找相邻文本行之间的切分轨迹,将多文本行答题卡分割成多个只包含一行字符的图片;针...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2-1卷积计算示意图??
?山东大学硕士学位论文???练的速度;对于输入小于0的神经元,经过激活函数都取值为0,在一定程度上??起到减少过拟合的作用;大于0的部分导数都为1,对于深层的网络结构避免了??Sigmoid和Tanh函数可能会在训练过程中出现的梯度消失的问题。??Sigmoid、Tanh、ReLu以及Softplus激活函数计算如公式(2-2)、公式(2-3)、??公式(2-4)及公式(2-5)所示,其对应的函数图像如图2-2所示:??Sigmoid?:?g(.v)?=?—^?(2-2)??1?+?e??一?^-X??Tanh:g(x)?=?- ̄-?(2-3)??e-\-e??ReLu:?g(x)?=?max(0,?jv)?(2-4)??Softplus?:?six)?=?log(l?+?ex?)?(2-5)???Sigmoid?5'?????Tanh?Z??—R心?4-?/???Softplus?/?????^?—i?-??图2-2激活函数图像??(3)池化层??池化层可以对特征图进行下采样,有效地降低数据维度,突出重要的关键??信息,避免数据冗余造成的过拟合和参数过多问题。池化层的下采样过程类似??于卷积运算,都是对上一层的输入数据依据一定的步长和池化核的大小从左到??右、从上到下地进行扫描采样,只不过是没有参数运算、不会改变特征图的数??量,只是对特征图进行了一定大小的收缩。??常用的池化操作有平均池化和最大池化,具体计算如公式(2-6)和公式(2-7)所??示,运算过程示意图如图2-3所示:??11??
?山东大学硕士学位论文???y?=-ZC;?(2-6)???/=1??pl?=?max?C/?(2-7)??/?eC’??其中,〃表示特征图池化区域中神经元的个数,对于一个JXj;大小的池化核,???为^的乘积大小,^表示特征图池化区域中第/个神经元。??特征图?池化核??..d?:1?I.?1?繼输出??j?2?2??在辛d',?2??S?3???4?,?I?_? ̄?—S??t?t"?池傾作?'U‘-j??3?3?4?4??图2-3池化操作示意图??(4)全连接层??全连接层实现神经节点之间的全部连接,实现对全局信息的处理和分析。为??防止过拟合现象的发生,在网络训练过程中采用Dr〇P〇Ut[29]方法随机舍弃部分神??经元的输入。全连接计算如公式(2-8)所示,采用Dropout的全连接如图2-4所示:??(2-8)??/=1??其中,/;表示第/层全连接第J个神经元的值,<表示该层的参数,V是偏??置,m表示上一层神经元的个数。??图2-4带有Dropout的全连接层??一般对网络进行训练时会对训练数据进行批归一化处理(Batch?Normalization,??BN)?t24],使输入数据尽可能符合正态分布。BN操作会对每一个批次的训练数据??求取对应的均值和方差,之后对输入数据进行规范化,使数据趋向于真实数据的??12??
【参考文献】:
期刊论文
[1]脱机无约束手写体中文文本行的字符切分方法[J]. 李南希,金连文. 华南理工大学学报(自然科学版). 2010(10)
[2]笔迹图像中的单个汉字字符分割[J]. 于明,张彦云,薛翠红,孙林娟. 计算机工程与应用. 2010(09)
[3]关于手写汉字切分方法的思考[J]. 邵洁,成瑜. 计算机技术与发展. 2006(06)
[4]基于连通域的汉字切分技术研究[J]. 陈艳,孙羽菲,张玉志. 计算机应用研究. 2005(06)
[5]基于部件HMM级联的联机手写体汉字识别方法[J]. 赵巍,刘家锋,唐降龙. 哈尔滨工业大学学报. 2004(05)
[6]基于连通域单元和穿越算法的汉字切分[J]. 王琳琬,杨扬,颉斌,杨毅. 信息技术. 2004(04)
[7]非限定手写汉字的分割研究[J]. 陈强,娄震,杨静宇. 南京理工大学学报(自然科学版). 2004(01)
[8]一种离线手写体汉字切分的自适应算法[J]. 朱锴,赵宇明,吴越. 计算机工程与应用. 2004(06)
[9]HMM方法识别脱机手写汉字[J]. 冯兵,丁晓青,吴佑寿. 模式识别与人工智能. 2002(01)
[10]基于汉字结构特征的自由格式手写体汉字切分[J]. 吕岳,施鹏飞,张克华. 电子学报. 2000(05)
博士论文
[1]非限制手写字符分割中相关技术与算法的研究[D]. 马瑞.南京理工大学 2007
硕士论文
[1]基于SVM的脱机手写体汉字识别方法的研究[D]. 项思俊.合肥工业大学 2009
[2]基于半阈值的字符分割与识别研究[D]. 潘振兴.国防科学技术大学 2008
[3]基于灰度图像的字符切分技术的研究[D]. 陈艳.中国科学院研究生院(计算技术研究所) 2004
本文编号:3240296
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2-1卷积计算示意图??
?山东大学硕士学位论文???练的速度;对于输入小于0的神经元,经过激活函数都取值为0,在一定程度上??起到减少过拟合的作用;大于0的部分导数都为1,对于深层的网络结构避免了??Sigmoid和Tanh函数可能会在训练过程中出现的梯度消失的问题。??Sigmoid、Tanh、ReLu以及Softplus激活函数计算如公式(2-2)、公式(2-3)、??公式(2-4)及公式(2-5)所示,其对应的函数图像如图2-2所示:??Sigmoid?:?g(.v)?=?—^?(2-2)??1?+?e??一?^-X??Tanh:g(x)?=?- ̄-?(2-3)??e-\-e??ReLu:?g(x)?=?max(0,?jv)?(2-4)??Softplus?:?six)?=?log(l?+?ex?)?(2-5)???Sigmoid?5'?????Tanh?Z??—R心?4-?/???Softplus?/?????^?—i?-??图2-2激活函数图像??(3)池化层??池化层可以对特征图进行下采样,有效地降低数据维度,突出重要的关键??信息,避免数据冗余造成的过拟合和参数过多问题。池化层的下采样过程类似??于卷积运算,都是对上一层的输入数据依据一定的步长和池化核的大小从左到??右、从上到下地进行扫描采样,只不过是没有参数运算、不会改变特征图的数??量,只是对特征图进行了一定大小的收缩。??常用的池化操作有平均池化和最大池化,具体计算如公式(2-6)和公式(2-7)所??示,运算过程示意图如图2-3所示:??11??
?山东大学硕士学位论文???y?=-ZC;?(2-6)???/=1??pl?=?max?C/?(2-7)??/?eC’??其中,〃表示特征图池化区域中神经元的个数,对于一个JXj;大小的池化核,???为^的乘积大小,^表示特征图池化区域中第/个神经元。??特征图?池化核??..d?:1?I.?1?繼输出??j?2?2??在辛d',?2??S?3???4?,?I?_? ̄?—S??t?t"?池傾作?'U‘-j??3?3?4?4??图2-3池化操作示意图??(4)全连接层??全连接层实现神经节点之间的全部连接,实现对全局信息的处理和分析。为??防止过拟合现象的发生,在网络训练过程中采用Dr〇P〇Ut[29]方法随机舍弃部分神??经元的输入。全连接计算如公式(2-8)所示,采用Dropout的全连接如图2-4所示:??(2-8)??/=1??其中,/;表示第/层全连接第J个神经元的值,<表示该层的参数,V是偏??置,m表示上一层神经元的个数。??图2-4带有Dropout的全连接层??一般对网络进行训练时会对训练数据进行批归一化处理(Batch?Normalization,??BN)?t24],使输入数据尽可能符合正态分布。BN操作会对每一个批次的训练数据??求取对应的均值和方差,之后对输入数据进行规范化,使数据趋向于真实数据的??12??
【参考文献】:
期刊论文
[1]脱机无约束手写体中文文本行的字符切分方法[J]. 李南希,金连文. 华南理工大学学报(自然科学版). 2010(10)
[2]笔迹图像中的单个汉字字符分割[J]. 于明,张彦云,薛翠红,孙林娟. 计算机工程与应用. 2010(09)
[3]关于手写汉字切分方法的思考[J]. 邵洁,成瑜. 计算机技术与发展. 2006(06)
[4]基于连通域的汉字切分技术研究[J]. 陈艳,孙羽菲,张玉志. 计算机应用研究. 2005(06)
[5]基于部件HMM级联的联机手写体汉字识别方法[J]. 赵巍,刘家锋,唐降龙. 哈尔滨工业大学学报. 2004(05)
[6]基于连通域单元和穿越算法的汉字切分[J]. 王琳琬,杨扬,颉斌,杨毅. 信息技术. 2004(04)
[7]非限定手写汉字的分割研究[J]. 陈强,娄震,杨静宇. 南京理工大学学报(自然科学版). 2004(01)
[8]一种离线手写体汉字切分的自适应算法[J]. 朱锴,赵宇明,吴越. 计算机工程与应用. 2004(06)
[9]HMM方法识别脱机手写汉字[J]. 冯兵,丁晓青,吴佑寿. 模式识别与人工智能. 2002(01)
[10]基于汉字结构特征的自由格式手写体汉字切分[J]. 吕岳,施鹏飞,张克华. 电子学报. 2000(05)
博士论文
[1]非限制手写字符分割中相关技术与算法的研究[D]. 马瑞.南京理工大学 2007
硕士论文
[1]基于SVM的脱机手写体汉字识别方法的研究[D]. 项思俊.合肥工业大学 2009
[2]基于半阈值的字符分割与识别研究[D]. 潘振兴.国防科学技术大学 2008
[3]基于灰度图像的字符切分技术的研究[D]. 陈艳.中国科学院研究生院(计算技术研究所) 2004
本文编号:3240296
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3240296.html