基于深度模型的脱机手写体汉字识别研究
本文关键词:基于深度模型的脱机手写体汉字识别研究
更多相关文章: 卷积神经网络 递归神经网络 深度学习 脱机手写体汉字识别
【摘要】:手写体汉字识别在残疾人无障碍阅读、文献自动翻译、文献自动录入、金融单据的处理、快递包裹和信件的分拣等领域有着广阔的应用前景,帮助使用者自动录入文字,节省劳动力成本。它涉及机器学习、模式识别、数字图像处理、人工智能、自然语言处理、统计学、信息论等多门学科。由于每个人的书写习惯不同、汉字笔画粘连等因素,脱机手写体汉字识别是中文OCR领域最具挑战性的问题。因此,本文提出基于深度学习的脱机手写体汉字识别方法。针对无遮挡的手写体汉字图像,本文采取基于深度卷积神经网络的分类算法,直接使用预处理后的图像数据作为分类器的输入。针对深度卷积神经网络容易过拟合的特点,本文提出滑动窗口和弹性形变的方式等扩充训练数据集,提升模型的鲁棒性和泛化能力。本文使用多个不同结构的卷积神经网络对手写体汉字图像进行分类,然后将其融合,进一步提升模型效果。针对古籍扫描和手写稿件扫描中出现的文字破损、文字被污迹遮挡等情况,提出基于深度递归网络和深度信念网络的有遮挡的手写体汉字的识别方法。首先使用两个深度递归神经网络从有遮挡的汉字图像和无遮挡的汉字图像中提取高层抽象特征,然后训练深度信念网络将有遮挡手写体汉字的特征空间转换到无遮挡手写体汉字的特征空间,接着用深度玻尔兹曼机进行分类,最后添加深度卷积网络隐含层提取的特征改善识别准确率。实验结果表明,本文提出的无遮挡手写体汉字图像识别算法和有遮挡手写体汉字识别算法均具有较好的识别效果。
【关键词】:卷积神经网络 递归神经网络 深度学习 脱机手写体汉字识别
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.43
【目录】:
- 摘要5-6
- ABSTRACT6-13
- 第1章 绪论13-18
- 1.1 课题背景13-14
- 1.2 课题难点14-16
- 1.3 本文工作16
- 1.4 本文组织结构16-17
- 1.5 本章小结17-18
- 第2章 脱机手写体汉字识别技术综述18-37
- 2.1 图像预处理方法综述18-24
- 2.1.1 二值化18-20
- 2.1.2 图像平滑20-21
- 2.1.3 腐蚀膨胀21-23
- 2.1.4 归一化23-24
- 2.2 手写体汉字特征提取方法综述24-28
- 2.2.1 弹性网格24-26
- 2.2.2 汉字分解和方向特征提取26-28
- 2.3 图像分类方法综述28-36
- 2.3.1 Adaboost算法28-31
- 2.3.2 决策树算法31-33
- 2.3.3 SVM算法33-36
- 2.4 本章小结36-37
- 第3章 无遮挡手写体汉字识别37-57
- 3.1 研究背景37
- 3.2 问题描述37-38
- 3.3 数据集38-41
- 3.3.1 CASIA-HWDB1.1数据集38-39
- 3.3.2 数据预处理与数据集构造39-41
- 3.4 基于深度卷积神经网络的手写体汉字识别41-51
- 3.4.1 卷积神经网络41-44
- 3.4.2 卷积神经网络的训练44-46
- 3.4.3 卷积神经网络结构46-49
- 3.4.4 基于多网络融合的手写体汉字识别49-51
- 3.5 实验结果51-55
- 3.5.1 实验环境51
- 3.5.2 基于深度卷积神经网络的手写体汉字识别51-54
- 3.5.3 基于多网络融合的手写体汉字识别54-55
- 3.6 本章小结55-57
- 第4章 有遮挡手写体汉字识别57-76
- 4.1 问题描述57
- 4.2 数据集构造57-58
- 4.3 递归神经网络58-64
- 4.3.1 递归神经网络58-61
- 4.3.2 基于RNN的卷积网络61-63
- 4.3.3 基于ReNet的汉字特征提取63-64
- 4.4 基于深度信念网络的特征映射64-72
- 4.4.1 深度信念网络64-70
- 4.4.2 基于DNN的特征映射70-72
- 4.5 基于DBM的汉字分类72
- 4.6 实验结果72-75
- 4.7 本章小结75-76
- 第5章 总结与展望76-78
- 5.1 本文工作小结76-77
- 5.2 未来工作展望77-78
- 参考文献78-83
- 致谢83
【相似文献】
中国期刊全文数据库 前10条
1 刘伟;王建平;李秀娟;;基于智能结构模型的手写体汉字识别方法研究[J];巢湖学院学报;2011年06期
2 谢克中;;联机手写体汉字识别[J];中南矿冶学院学报;1985年02期
3 李迈;中国科学院自动化研究所研制成功特定人手写体汉字识别系统[J];高技术通讯;1996年01期
4 余楚中,赵学军,彭静,郑胜林;联机手写体汉字识别中的笔划分类及笔划识别[J];重庆大学学报(自然科学版);1998年02期
5 余楚中,赵学军,蔡雷,潘保昌;联机手写体汉字识别方法的研究[J];重庆大学学报(自然科学版);1998年03期
6 王正群,孙兴华,杨静宇;基于子笔划的手写体汉字识别[J];南京理工大学学报(自然科学版);2002年04期
7 刘峡壁,贾云得;用于手写体汉字识别的汉字结构模型[J];北京理工大学学报;2003年03期
8 高彦宇,杨扬;基于正交特征的手写体汉字识别方法[J];仪器仪表学报;2003年S2期
9 史绍强,王英健,唐贤瑛;基于整形特征和模糊识别的手写体汉字识别[J];微机发展;2004年01期
10 高彦宇,杨扬,颉斌;脱机手写体汉字识别中多模板字典的制作方法[J];计算机工程;2005年02期
中国重要会议论文全文数据库 前8条
1 高彦宇;杨扬;;基于正交特征的手写体汉字识别方法[A];首届信息获取与处理学术会议论文集[C];2003年
2 王建平;潘乐;;基于广义误差反馈的手写体汉字识别系统研究[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
3 林磊;王晓龙;徐志明;;基于语言学知识的多分类器融合方法在手写体汉字识别中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 王建平;陈正伟;栾庆磊;金铁江;;基于遗传算法的汉字识别决策系统的研究[A];中国计量协会冶金分会2008年会论文集[C];2008年
5 王建平;陈正伟;栾庆磊;金铁江;;基于遗传算法的汉字识别决策系统的研究[A];2008全国第十三届自动化应用技术学术交流会论文集[C];2008年
6 曹鹤;裴明涛;贾云得;;一种基于上下文的手写体汉字识别候选集选取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 秦朗;;基于二叉树多层分类SVM的脱机手写体汉字识别[A];第十九届测控、计量、仪器仪表学术年会(MCMI'2009)论文集[C];2009年
8 宁薇;郑翔;金奕江;赵雁南;马少平;;基于ASIC识别卡的脱机手写体汉字识别系统[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前4条
1 王正群;手写体汉字识别研究[D];南京理工大学;2001年
2 金连文;手写体汉字识别的研究[D];华南理工大学;1996年
3 居琰;基于多层次信息融合的手写体汉字识别研究[D];重庆大学;2002年
4 朱宁波;小类别无限制手写体汉字识别研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 周星辰;基于深度模型的脱机手写体汉字识别研究[D];浙江大学;2016年
2 王二帅;基于广义特征反馈的手写体汉字识别系统研究[D];合肥工业大学;2010年
3 张大敏;基于变精度粗糙集的手写体汉字识别方法的研究[D];合肥工业大学;2010年
4 丁慧东;脱机手写体汉字识别研究[D];东北师范大学;2005年
5 蔺菲;手写体汉字识别的研究[D];合肥工业大学;2006年
6 冯志敏;基于结构特征的手写体汉字识别研究[D];云南师范大学;2006年
7 潘乐;基于反馈结构的手写体汉字识别系统研究[D];合肥工业大学;2008年
8 谢玉芯;手写体汉字识别方法研究[D];天津大学;2010年
9 常欢;基于卷积神经网络的孤立手写体汉字识别研究[D];安徽大学;2015年
10 侯艳平;脱机手写体汉字识别研究[D];扬州大学;2008年
,本文编号:610048
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/610048.html