基于改进模糊支持向量机的西夏文字识别研究
【学位单位】:兰州交通大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:H211.7;TP391.41;TP18
【部分图文】:
- 5 -图 2.1 西夏文字示例分析这 6000 多个字的骨架结构,可以得出如下结论:(1) 大部分字体的笔画都很繁杂,并且平均笔画达到 25 画。计算机识别难以入手。(2) 与汉字相似,都由竖、撇、捺、折、勾等笔画组成,但其中斜笔较多。(3) 西夏文字中存在很多形近字,将文字左右部分互换得到的文字往往是原文字的近义字。关于西夏文字的编码工作,李汉文先生编写的《夏汉字典》是迄今为止第一部系统的,完备的西夏文与汉文对照的字典,其中,李汉文先生提出了四角编码方法将西夏文的笔形划分为九种类型,并分别用数字 1-9 来表示,0 用来表示没有笔形。如图 2.2 是西夏文字的笔形和对应的代码。
图 2.2 西夏文字笔形表因为西夏文字笔画繁杂,如果只用四角编码就会发生重码的现象即不同文字有的编码。为了解决这个问题,后来又在四位编码后添加了两位附加码。四角码的编序是按照左上、右上、左下和右下的顺序。附加码的编码顺序是按靠近左下角在先近右下角在后。可是即使这样依然无法解决所有文字的重码问题,如图 2.3 中所示个西夏文字的编码都是 101000。图 2.3 四角编码重码文字
图 2.2 西夏文字笔形表因为西夏文字笔画繁杂,如果只用四角编码就会发生重码的现象即不同文字有码。为了解决这个问题,后来又在四位编码后添加了两位附加码。四角码的编按照左上、右上、左下和右下的顺序。附加码的编码顺序是按靠近左下角在先下角在后。可是即使这样依然无法解决所有文字的重码问题,如图 2.3 中所示夏文字的编码都是 101000。
【相似文献】
相关期刊论文 前10条
1 ;新华智云推出25款媒体机器人,解决媒体人痛点[J];传媒;2019年17期
2 张华萍;黄辰;;文字识别技术研究[J];物联网技术;2018年08期
3 浦世亮;程战战;;基于注意力矫正的自然场景文字识别[J];中国公共安全;2017年09期
4 盛寁;刘伟;;计算机文字识别的发展及应用[J];科技信息;2008年31期
5 Jay;文字识别网上行[J];电脑应用文萃;2005年02期
6 柳玉辉;计算机文字识别的技术探讨与应用前景分析[J];软件工程师;1999年04期
7 郭军,马跃,盛立东,钟义信;发展中的文字识别理论与技术[J];电子学报;1995年10期
8 张开;岑翠;李林献;谢雨非;;基于蚁群算法的文字识别[J];信息与电脑(理论版);2019年22期
9 弓耀辉;;图像文字识别中的预处理技术研究综述[J];信息通信;2017年09期
10 孙承鉴,张大华;手写文字识别技术及其在图书馆的应用[J];现代图书情报技术;1993年01期
相关博士学位论文 前5条
1 姚超;降维算法和手写文字识别中若干问题研究[D];西安电子科技大学;2014年
2 许亚美;手写维吾尔文字识别若干关键技术研究[D];西安电子科技大学;2014年
3 姚聪;自然图像中文字检测与识别研究[D];华中科技大学;2014年
4 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
5 玛依热·依布拉音;联机手写维吾尔文字母与单词识别研究[D];武汉大学;2013年
相关硕士学位论文 前10条
1 刘兴长;基于改进模糊支持向量机的西夏文字识别研究[D];兰州交通大学;2019年
2 杨海林;基于深度学习的古籍文字识别和检测[D];华南理工大学;2019年
3 李小璐;基于优化分割与提取的西夏古籍文字识别研究[D];宁夏大学;2019年
4 杨宏志;基于深度学习的自然场景文字识别[D];重庆邮电大学;2019年
5 游京翰;基于深度学习的文字序列识别系统[D];哈尔滨工业大学;2018年
6 高威威;基于深度学习的自然场景文字识别[D];安徽大学;2019年
7 赵星驰;基于深度学习的视频文字检测技术[D];北京邮电大学;2019年
8 张博;基于深度置信网络的图像识别算法研究[D];哈尔滨理工大学;2019年
9 邵文良;基于深度学习的医疗单据图文识别关键技术研究与实现[D];北京邮电大学;2019年
10 邹瑞杰;基于深度学习的自然英文文字识别的研究[D];电子科技大学;2019年
本文编号:2856054
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2856054.html