当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于深度学习的水书图像识别算法研究与应用

发布时间:2020-04-29 05:23
【摘要】:语言文字是一个民族的精神文明之一,文字识别技术对文字的传播和文化传承起到很好的推进作用。在我国贵州地区有一种语言文字——水书,是一种古老的类象形文字,由于传承人员稀缺,导致水书传承中断,所以迫切需要进行数字化保护。传统的文字识别技术多是采用手动提取特征,然后设计分类器进行识别的模式。手动提取特征对专业知识的要求较高,人力成本也比较高,然而识别效果却不太理想。深度学习在模式识别任务方面的表现良好,给少数文字识别相关研究人员带来了新的灵感,并尝试使用深度学习来解决文字识别问题。基于深度学习的方法实现水书识别存在着几个问题。第一,水书目前还没有用于数据科学研究的完备数据集,缺乏专业数据人员对水书文字进行整理、存储、归类;第二,深度学习模型多种多样,多数是针对某一个问题而设计的,可移植性较差,科研人员将深度学习方法在水书识别上的尝试较少;第三,深度学习模型训练时的超参数设置很大程度上影响了模型的性能,超参数优化问题是诸多研究人员致力解决的问题。针对上述问题,本文对深度神经网络模型进行研究,设计了一个用于水书识别的卷积神经网络模型,并通过一种基于种群进化的超参数优化算法进行训练,实现水书文字识别任务。具体工作如下:1.提出一种基于种群进化的超参数优化算法。本文结合网格搜索与人工调试的优点,从进化算法中获得启发,提出一种基于种群进化的超参数优化算法,其主要思想是个体进化,种群选择,异步并行迭代训练以达到种群进化的结果。实验结果表明,在超参数设置问题上此算法相较于网格搜索有更优的效果。2.设计了一个应用于水书识别的卷积神经网络模型。通过理论验证,经验积累,本文详细分析了卷积神经网络的结构组成,论证了损失函数、激活函数等选择问题,设计了一个11层卷积网络结构,并采用本文提出的基于种群进化的超参数优化算法进行训练,在水书数据集数据量较多的标注集上进行训练验证,证实了模型设计的有效性。3.本文建立了一个水书古籍文字数据集,为深度学习的研究提供了实验数据。文中详细介绍了水书特点,从数据采集、到数据预处理、再到数据标注,详细介绍了水书数据集建立过程。设计了一个水书文字识别原型系统,将数据处理和文字识别功能进行集成,为水书的学习和传播提供了方便。综上,本文提出的基于种群进化的超参数优化算法为神经网络超参数设置提供了借鉴方法,水书文字识别的研究可以作为少数民族语言保护和文字识别的一个经验案例,为文字学和深度学习工作者进行深入研究作参考。
【图文】:

框架图,文字识别,重要意义,框架


2.1.2研究内容与系统框架逡逑由上一节的分析己经明确了本文的主要研究任务,,这里通过一个框架图来展开描述逡逑研究内容,如图2-1所示。逡逑MM邋----逦■-逡逑_邋-—二--?_逡逑I逡逑l逦选择CNN网络邋n逦24邋..邋,邋^邋^逦taamt^on邋I邋f&Sr^逦灥逡逑: ̄ ̄ ̄ ̄ ̄1逦,邋,U邋a、[卜邋5邋i逡逑_廔逦i逦a逦^f9逦h邋i逦!逦|逡逑!邋逦逦二二 ̄ ̄ ̄…二二-二二.1^11邋二二二二.二..二一逦1逡逑「?;逦—一]逡逑.崣参数抚化逦Seep逦JEvafe减》i逦£xpk细son逦p咖ryUon逡逑丨..':.:fI逦m:」s邋■逦1|逡逑;逡逑:逡逑Q^2^g^2jj22iss邋ss^^sssmsaasa逦■逦逦邋逦邋……逦逦逡逑逦逦逦逦邋.邋H.邋m逦?邋_邋攦逡逑5ilf]邋_邋P^"邋1邋i邋t邋^-4r逡逑*sa?0i逡逑ggggg^gg^jgggggg^邋fe^S8838^8%BSB88iW逡逑App逦座务窠群逡逑图2-1基于深度学习的水书文字识别框架逡逑水书文字图像数据库的建立是一件非常有价值的工作,不仅在数据科学方面,在文逡逑化保护方面也有着重要意义。本文在第四章详细介绍了从水书数据采集到数据预处理,逡逑再到数据标注等详细过程。由于水书文字具有特殊性和小众性,所以对其认知存在一定逡逑难度,需要水书专家的参与。逡逑8逡逑

文字识别,模型设计,数据集


二值化、归一化等操作。但这还没有结束,数据虽然看起来很规整,但是并没有分类,逡逑没有标签作为后期识别的标准,所以需要对数据进行标注。经过一系列的处理,得到可逡逑以用来训练的数据量有10万余字,图2-2所示为得到的字符样例一水书中的“子”和逡逑“时辰”。在第四章详细介绍了数据集的构造流程。逡逑孑在N条七乇爸各尹尹歹尹歹歹歹,尹?泛逡逑毛友蚤壬孑孑孑;t系系尹尹歹歹歹夕歹歹歹尹逡逑士孑孑乇蚤圣手孑冬七尹步尹歹歹歹歹歹歹歹逡逑冬爹冬条七豸令圣孑孑尹歹歹歹歹尹歹歹矛歹逡逑壬乇圣乇圣;?手冬寻令罗歹歹歹逡逑图2-2水书数据集样例逡逑2.4水书文字识别CNN模型设计逡逑本文的最终目的是实现水书古籍图像文字识别,本模块的主要任务是设计一个可以逡逑用来进行水书识别的CNN模型。卷积神经网络同时具有特征提取与分类识别功能,卷积逡逑层的作用是检测来自前一层的特征的局部连接并提取特征,池化层的作用是将语义相似逡逑的特征合并为一个。这里首先介绍了邋CNN基本原理,论证了损失函数如何选择的问题,逡逑设计了一个11层神经网络模型,并使用该模型对水书数据进行识别。逡逑10逡逑
【学位授予单位】:中央民族大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:H12;TP391.41;TP18

【相似文献】

相关期刊论文 前10条

1 朱汇龙;刘晓燕;刘瑶;;基于人群的神经网络超参数优化的研究[J];信息技术;2018年11期

2 翟桐,赵九江;超参数壳单元刚阵的简化积分法[J];哈尔滨工业大学学报;1985年A7期

3 姚诚伟;陈根才;;一种深度生成模型的超参数自适应优化法[J];实验室研究与探索;2018年02期

4 关青苗;;多层感知机中超参数的研究[J];南方农机;2018年02期

5 杨斌,聂在平;一种支持向量回归中超参数自适应方法[J];广西师范大学学报(自然科学版);2003年01期

6 陈志华;关富玲;蒋沧如;;基于超参数壳元卫星天线反射面稳态热分析[J];武汉理工大学学报;2008年04期

7 张波;沈火明;;基于Matlab的壳体有限元分析[J];重庆理工大学学报(自然科学版);2010年12期

8 金添;周智敏;宋千;常文革;;基于证据框架的模糊超球面支持向量机超参数优化[J];应用科学学报;2007年03期

9 李伟红;刘丽娟;龚卫国;辜小花;;人脸识别中基于均匀设计的SVM超参数调节方法[J];光电子.激光;2009年10期

10 张振朋;王以松;冯仁艳;李倩倩;;SVD++推荐算法的超参数[J];贵州大学学报(自然科学版);2018年03期

相关会议论文 前3条

1 孟增;张卓辉;;基于超参数凸模型的高效可靠性优化算法[A];2018年全国固体力学学术会议摘要集(上)[C];2018年

2 李洁;高峰;管晓宏;周佃民;;支持向量回归学习方法中基于稳定型GA的超参数选择[A];第二十四届中国控制会议论文集(下册)[C];2005年

3 张波;沈火明;;基于Matlab的壳体有限元分析[A];2010重庆汽车工程学会年会论文专辑[C];2010年

相关重要报纸文章 前1条

1 高波;为“超参数发电算违章”叫好[N];经理日报;2009年

相关硕士学位论文 前10条

1 夏春磊;基于深度学习的水书图像识别算法研究与应用[D];中央民族大学;2019年

2 周银达;基于群体的深度强化学习超参数自适应方法研究[D];中国科学技术大学;2019年

3 梁青青;基于关键超参数选择的监督式AutoML性能优化[D];贵州大学;2019年

4 陆高;基于智能计算的超参数优化及其应用研究[D];西安电子科技大学;2018年

5 刘丽娟;支持向量机超参数调节方法的研究及其在人脸识别中的应用[D];重庆大学;2010年

6 公彦杰;基于LS_SVM建立发酵过程动态模型的研究及软件实现[D];北京工业大学;2010年

7 侯文擎;基于改进堆叠降噪自编码网络的轴承故障诊断研究[D];华南理工大学;2017年

8 张立造;压缩感知理论与技术研究[D];电子科技大学;2016年

9 孙鑫;基于LS_SVM建立发酵过程动态模型及其参数优化[D];北京工业大学;2013年

10 崔虹雨;块稀疏信号重构算法研究[D];电子科技大学;2017年



本文编号:2644267

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2644267.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b1045***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com