当前位置:主页 > 科技论文 > 软件论文 >

基于深度学习的手写汉字识别技术研究

发布时间:2018-04-16 10:30

  本文选题:手写汉字识别 + 深度学习 ; 参考:《哈尔滨理工大学》2017年硕士论文


【摘要】:世界上使用人数最多、信息存储最简练、运用最广泛的语言文字,是中国传统文化和世界文化不可或缺的重要部分,所以针对汉字图像的识别研究具有非常重要的实用价值。手写汉字识别在日常的办公自动化、邮件分拣、金融等领域都具有非常很好的前景,手写汉字识别的研究可以使人们的日常生活更便捷。但是由于汉字的类别多,并且结构复杂,存在大量的相似汉字,再加上不同的人有不同的书写风格,在不同的书写环境、书写方式情况下,手写出来的汉字图像从种类和相似度等方面都很复杂,这就使得手写汉字识别在模式识别领域一直是难点同时也是研究热点。近年来,深度学习成为机器学习领域最热门的研究内容,尤其是在图像识别领域取得了非常好的效果。它能将复杂函数用更简洁的方式表达,可以自动获取样本概率分布同时在学习样本特征上具有优势。因此本文将深度学习模型应用到脱机手写汉字识别任务当中,通过使用深度学习中不同的方法和模型,进一步提高手写汉字识别的准确性。本文研究内容主要分以下几个方面:首先从深度信念网络入手,分析了传统手写汉字识别方法的不足,提出了一种基于深度信念网络融合模型对手写汉字识别的方法。该方法首先用修正的二次判别函数分类器识别较为简单的汉字,而较为复杂的汉字图像交给深度信念网络模型来处理,具体的分工过程通过定义可信度来协调两个分类器在识别任务中的分工,从而达到理想的识别效果。然后从卷积神经网络入手,卷积神经网络优于传统的图像分类方法在特征提取方面,所以将卷积神经网络应用在脱机手写汉字识别问题中。分析了卷积在手写汉字处理中的优缺点,针对相似手写汉字分类问题,进一步改进卷积神经网络,充分利用网络中特征提取的优势,二分类器则采用经典的SVM分类器,两者结合更好的对相似手写汉字识别分类。本文实验选用MNIST手写字、中国科学院自动化研究所采集的CASIA-HWDB1.1、北京邮电大学采集的HCL2000数据集。实验表明,本文提出的基于卷积神经网络的手写汉字识别方法能取得较好的识别效果。
[Abstract]:It is an indispensable part of Chinese traditional culture and world culture to use the largest number of people in the world, the most concise information storage, the most widely used language and characters, so the research on Chinese character image recognition has very important practical value.Handwritten Chinese character recognition has a very good prospect in the fields of office automation, mail sorting, finance and so on. The research of handwritten Chinese character recognition can make people's daily life more convenient.But because of the variety of Chinese characters, the complexity of their structure, the existence of a large number of similar characters, and the fact that different people have different writing styles, in different writing environments and ways of writing,Handwritten Chinese character images are very complex in terms of type and similarity, which makes handwritten Chinese character recognition difficult and research hotspot in the field of pattern recognition.In recent years, depth learning has become the most popular research content in machine learning field, especially in the field of image recognition.It can express the complex function in a more concise way, and it can automatically obtain the probability distribution of the sample and have the advantage in learning the feature of the sample.In this paper, the depth learning model is applied to the off-line handwritten Chinese character recognition task, and the accuracy of handwritten Chinese character recognition is further improved by using different methods and models in depth learning.The main contents of this paper are as follows: firstly, from the perspective of depth belief network, the shortcomings of traditional handwritten Chinese character recognition methods are analyzed, and a method of handwritten Chinese character recognition based on depth belief network fusion model is proposed.Firstly, the modified quadratic discriminant function classifier is used to recognize the simpler Chinese characters, and the more complex Chinese character images are processed by the depth belief network model.The specific process of division of labor coordinates the division of labor between the two classifiers in the recognition task by defining the credibility, so as to achieve the ideal recognition effect.Then, the convolution neural network is better than the traditional image classification method in feature extraction, so the convolution neural network is applied to the off-line handwritten Chinese character recognition problem.The advantages and disadvantages of convolution in handwritten Chinese character processing are analyzed. Aiming at the problem of similar handwritten Chinese character classification, the convolution neural network is further improved to make full use of the advantages of feature extraction in the network. The second classifier uses the classical SVM classifier.The combination of the two is better for the recognition and classification of similar handwritten Chinese characters.In this paper, MNIST handwritten, CASIA-HWDB1.1 collected by Institute of Automation, Chinese Academy of Sciences, and HCL2000 data set collected by Beijing University of posts and Telecommunications are selected.Experimental results show that the proposed method based on convolution neural network can achieve good recognition effect.
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.43;TP181

【相似文献】

相关期刊论文 前10条

1 王林泉;;关于手写汉字识别的研究[J];计算机研究与发展;1987年07期

2 ;汉王联机手写汉字识别第六版开发成功[J];自动化博览;1996年02期

3 薛炳如,杨静宇,胡钟山,娄震;小类别数手写汉字识别[J];计算机研究与发展;2000年04期

4 刘昌平,钱跃良,张永慧,宋东,李丰林;863手写汉字识别测试平台[J];中文信息学报;2000年02期

5 李宏东,叶秀清,顾伟康;知识基联机自然手写汉字识别[J];杭州电子工业学院学报;2000年06期

6 唐云廷,罗勇,周必水;基于参照模型的联机手写汉字笔划提取及识别[J];计算技术与自动化;2002年03期

7 张洪刚,刘刚,郭军;一种手写汉字识别结果可信度的测定方法及应用[J];计算机学报;2003年05期

8 赵姝岩,郭捷,施鹏飞;基于笔画分析和背景细化的粘连手写汉字切分[J];上海交通大学学报;2003年09期

9 俞庆英,吴建国;一种联机手写汉字识别算法的研究与实现[J];合肥学院学报(自然科学版);2004年01期

10 白宇,徐庆新,刘斌;基于语义的手写汉字识别模型[J];计算机工程与应用;2005年07期

相关会议论文 前8条

1 方应谦;张琦;;脱机手写汉字的模糊识别方法[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 卢达;浦炜;谢铭培;;基于SEART网和模糊相似测量的手写汉字预分类法[A];2005年全国自动化新技术学术交流会论文集[C];2005年

3 卢达;浦炜;谢铭培;;基于SEART网和模糊相似测量的手写汉字预分类法[A];2005全国自动化新技术学术交流会论文集(二)[C];2005年

4 吴天雷;马少平;;基于重叠动态网格和模糊方向线素特征的手写汉字识别[A];第八届全国汉字识别学术会议论文集[C];2002年

5 陈森;高学;;基于LDA的手写汉字特征选择方法[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年

6 刘丽艳;盛立东;;一个特定人手写汉字识别系统的实现[A];第八届全国汉字识别学术会议论文集[C];2002年

7 唐降龙;刘家锋;赵巍;;部件HMM级联的联机自由手写汉字识别方法[A];第八届全国汉字识别学术会议论文集[C];2002年

8 黄磊;刘昌平;刘迎建;;基于非参数化降维的手写汉字识别研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

相关重要报纸文章 前4条

1 顾艳伟;专家建议:书法应成为学生必修课[N];中国消费者报;2008年

2 早报记者 骆俊澎;莫让手写汉字成为他国的“非遗”[N];东方早报;2013年

3 本报通讯员 王莉 董洁;网友热议汉字书写[N];光明日报;2010年

4 记者 唐斌;汉王科技研制成功汉字手写芯片[N];计算机世界;2003年

相关博士学位论文 前4条

1 吕新桥;联机手写汉字识别技术研究[D];华中科技大学;2009年

2 苏哲文;手写汉字图像动态信息恢复方法研究[D];华中科技大学;2009年

3 高学;基于运动图像的手写汉字识别研究[D];华南理工大学;2003年

4 朱雷;古籍手写汉字图像分割算法研究[D];重庆大学;2011年

相关硕士学位论文 前10条

1 李小园;基于结构分析的离线手写汉字切分[D];河北大学;2009年

2 刘欣;基于卷积神经网络的联机手写汉字识别系统[D];哈尔滨工业大学;2015年

3 孙巍巍;基于深度学习的手写汉字识别技术研究[D];哈尔滨理工大学;2017年

4 罗巧玲;联机手写汉字识别关键技术研究[D];华中科技大学;2009年

5 黄盛明;联机手写汉字的旋转无关识别研究[D];华南理工大学;2010年

6 王有旺;深度学习及其在手写汉字识别中的应用研究[D];华南理工大学;2014年

7 刘晓娟;联机手写汉字识别中字根提取算法研究[D];华中科技大学;2008年

8 崔景楠;基于笔顺重排的联机手写汉字识别的研究与实现[D];辽宁工程技术大学;2009年

9 刘学文;聚类分析在手写汉字识别中的应用[D];华南理工大学;2010年

10 莫咏柳;基于支持向量机的联机手写汉字识别的研究[D];太原理工大学;2011年



本文编号:1758520

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1758520.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户692cd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com