西夏文字数字信息化若干问题研究
【学位单位】:北京交通大学
【学位级别】:博士
【学位年份】:2019
【中图分类】:H211.7;TP18;TP391.41
【部分图文】:
角号码编码为2244的字有60个之多。为了克服这一问题,西夏文字四角编码增??加了副码,将文字底边中间的两部分笔画所对应的码号作为副码,使用6位数码??对每一个字符进行编码,有效降低了重码率。副码编码范例如图4所示。图1、??图3、图4中的图例均来自古今文字集成网站[12]。??M?M?i艰??US:??图4副码编码范例[12]??Figure?4?Example?of?sub-coding[l21??2.3基于文字构件的西夏文字四角编码识别方法??四角编码不仅是有效的文字检索方法,同时也为西夏文字识别提供了一个思??路。按照字符图像特征生成的方式可分成:局部特征、全局特征、结构特征。局??部特征指不考虑字符结构信息,而通过局部变换得到的特征;全局特征指不考虑字??符结构信息,而通过全部变换得到的特征;结构特征则指字符笔画结构的特征。针??对西夏文字笔划繁复,识别难度大的问题,如果能够把一个字符的结构特征解析??提取出来,识别出字符四角的部首,笔划或字符构件,根据每个构件所对应的编??码即可得出该字符的四角编码。??这一方案的难点首先在于文字字符的拆解,如何从一个文字图像中分离提取??11??
将文字底边中间的两部分笔画所对应的码号作为副码,使用6位数码??对每一个字符进行编码,有效降低了重码率。副码编码范例如图4所示。图1、??图3、图4中的图例均来自古今文字集成网站[12]。??M?M?i艰??US:??图4副码编码范例[12]??Figure?4?Example?of?sub-coding[l21??2.3基于文字构件的西夏文字四角编码识别方法??四角编码不仅是有效的文字检索方法,同时也为西夏文字识别提供了一个思??路。按照字符图像特征生成的方式可分成:局部特征、全局特征、结构特征。局??部特征指不考虑字符结构信息,而通过局部变换得到的特征;全局特征指不考虑字??符结构信息,而通过全部变换得到的特征;结构特征则指字符笔画结构的特征。针??对西夏文字笔划繁复,识别难度大的问题,如果能够把一个字符的结构特征解析??提取出来,识别出字符四角的部首,笔划或字符构件,根据每个构件所对应的编??码即可得出该字符的四角编码。??这一方案的难点首先在于文字字符的拆解,如何从一个文字图像中分离提取??11??
针对这一问题,可以考虑将对西夏字符构件的识别到四角编码的映射作为初??级分类。在解析出西夏字符的四角编码后,列出所有与该编码对应的同码的字符??集,然后进行二级分类识别,在同码字集中找出识别对象,识别流出如图6所示。??在二级分类阶段,用来比对选择的样本类别数量大幅度降低,可以选用运算量大??而精读较高的算法,同时根据辨识对象的特点,有效降低运算量。??编号为174200??的字符集??初级分类?4?2????二级分类?, ̄^???霖叫在重」;,行??图6西夏文多级分类识别??Figure?6?Multilevel?classification?recognition?of?Tangut?character??2.4?HTGE在西夏文字笔画检测中的应用??针对前文所述的文字结构特征解析环节,本文提出HTGE?(Hough?Transform??with?Guidance?of?Endpoints,端点引导的霍夫变换)算法应用于西夏文字笔划的检??测。HTGE在传统霍夫变换的基础上考虑线段端点信息对线段检测有效引导,这一??改进可以有效提高对近似直线的曲线容错能力
【相似文献】
相关期刊论文 前10条
1 梁松涛;;四十年来西夏文学研究的回顾与展望[J];西夏研究;2018年04期
2 史金波;;西夏文明在中国文明史上的地位[J];文史知识;2017年03期
3 馬振穎;;2015年西夏學研究論著目録[J];敦煌学国际联络委员会通讯;2016年00期
4 彭程;;宁夏主题酒店的发展前景——以西夏文化为例[J];才智;2013年09期
5 温晋林;西夏文化专题旅游开发[J];宁夏大学学报(自然科学版);1999年02期
6 牛达生 ,刘天明;见解独具、内容翔实的西夏学专著——《西夏文化》[J];民族研究;1988年06期
7 陈炳应;《西夏文化》评介[J];中央民族学院学报;1988年04期
8 张云;;论吐蕃文化对西夏的影响[J];中国藏学;1989年02期
9 李晓春;;西夏文书籍装帧艺术特点初探[J];创意与设计;2017年06期
10 陈思博;;宁夏的西夏文化遗产与旅游产业[J];艺术品鉴;2018年17期
相关博士学位论文 前1条
1 孟一飞;西夏文字数字信息化若干问题研究[D];北京交通大学;2019年
相关硕士学位论文 前9条
1 贾搏;西夏文《现在贤劫千佛名经》(上卷)考释[D];陕西师范大学;2018年
2 杨文慧;西夏古籍文字样本数据库的创建及应用技术研究[D];宁夏大学;2018年
3 白乖乖;西夏与周边民族的佛教关系[D];北方民族大学;2018年
4 余惠娟;西夏文契约的担保与汉文契约担保的比较研究[D];武汉大学;2018年
5 曾金雪;西夏文《大般涅槃经》卷二十二译释研究[D];陕西师范大学;2018年
6 周媛;宁夏的西夏文化遗产与旅游产业[D];华中师范大学;2011年
7 米晨榕;西夏教育刍议[D];陕西师范大学;2015年
8 郭迎春;论宁夏平原在西原历史上的地位[D];河北大学;2007年
9 李晓玲;帝王陵墓类旅游产品开发研究[D];西安建筑科技大学;2007年
本文编号:2845460
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2845460.html