基于HMM与决策树的多字体阿拉伯文的字符识别
本文关键词:基于HMM与决策树的多字体阿拉伯文的字符识别,,由笔耕文化传播整理发布。
【摘要】:光学字符识别(OCR)是许多语言己成熟的一种模式识别技术特别是拉丁和中文,但对于阿拉伯文它仍然处于早期阶段。近日,阿拉伯文的手写和机打文字识别受到了很大的关注,但大部分出版物都同意了一点:与其他语言相比,处理阿拉伯文本图像是一个难度很高的问题。这是由于阿拉伯文字系统具有很多使识别难度增高的特征,这样的特征有:阿拉伯文本,包括手写体和印刷体都是连接的,手稿是从右往左的书写顺序,字母的形态取决于它在词中出现的位置“同一个字母在词首和词尾有着截然不同的形态”,字母重叠,变音符号,字母之间的横笔延长与在同一个字体下字母有不同大小。所有这些特性会以不同的方式影响处理和识别阿拉伯字符,使采用一个以拉丁字符为基础的改进方法来处理阿拉伯文是不可能的。 目前所有提出处理阿拉伯文的方法的主要问题是,它们都没有考虑阿拉伯文字的特征。他们描述这些特征时仅为了表明这些特征对识别阿拉伯文增加了多少复杂性,并不考虑到这些特征可能会有一些能简化阿拉伯文处理和识别的优点。不过,在这篇论文中,我们描述了如何使用阿拉伯文的书写特征并使识别任务更为简单,建立了一个非常强大的多字体阿拉伯文机打的OCR系统。这些特征是:行草书写,位置相关的字符形状和变音符号。 除了字符识别,字体识别(OFR)是OCR系统中不可缺少的模块,其能增加OCR系统的效率和识别率。自动文档处理(ADP)技术对OFR和OCR的混合处理提出了两个主要方案。第一个方案,它概括了文档中所有字符的字体类型。使用这种方案使我们能够减少字母数量但输出的结果只能有一种字体。第二个方案是先识别文档中的字体再识别字符。第二个方案虽然很重要,但通常被忽视的。 变音符号是阿拉伯文书写系统特有的现象。当波斯语,乌尔都语和普什图语等语言采用了阿拉伯文书写系统时,变音符号才被引进到阿拉伯文书写系统里。在这篇论文中,我们展示了变音符号的重要性,以及我们如何使用它来增加阿拉伯语OCR系统的精度和可靠性。首先,我们使用变音符号来识别字体,然后我们建立了一个字符识别系统并用变音符号来完善其识别结果。 在这篇论文中,我们实现了一个多字体阿拉伯文OCR系统。它包括文档预处理,特征提取和分类。该系统使用了两个不同的数据库,一个用来做字体识别,另一个用来做字符识别测试。我们的主要研究工作如下: ·变音符号分割:本文提出了三中不同的变音符号分割算法。取决于文档图像的数量和复杂性,我们可以分割出所有变音符号并将它用于字体识别。分割后剩余的文本正文将被用于字符识别。 ·特征提取:根据任务,我们采用了两种不同类型的特征提取方法。对于字体识别,我们采用了复合中央和环形投影特征。对于字符识别我们采用了多层分离特征。 ·分类:我们使用了归一化互相关为字体分类以及隐马尔可夫模型为字符识别。我们将隐马尔可夫模型的输出送入到一个决策树然后把原始文字图像 与HMM模型的输出结合起来,以为每一个字符分配最恰当的变音符号。 实验结果表明,我们的方法对于阿拉伯文字体和字符识别是有效的。与其他方法相比,我们的方法最明显的优点是能把变音符号的模糊问题完全抵消。我们的方法的另一个主要优点是让字体和字符识别的许多预处理模块可以在两个任务之间共享,这不仅是减少了系统设计而加速系统处理时间。
【关键词】:阿拉伯文 变音符号 复合中央和环形投影 隐马尔可夫模型 归一化互相关 决策树
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要4-6
- Abstract6-12
- List of Figures12-14
- List of Tables14-15
- 1 Introduction15-27
- 1.1 Optical Character Recognition15-16
- 1.2 Arabic Optical Character Recognition16-21
- 1.3 Arabic Optical Font Recognition21-22
- 1.4 Related Work22-25
- 1.4.1 OFR Related Work22-24
- 1.4.2 OCR Related Work24-25
- 1.5 Thesis Organization25-27
- 2 Arabic Writing System27-39
- 2.1 Ligatures30-31
- 2.2 Arabic Diacritics31-35
- 2.3 Arabic Text in Computer Systems35-39
- 3 Hidden Markov Models,Decision Tree and HTK39-63
- 3.1 Hidden Markov Models39-53
- 3.1.1 Model Topologies41-45
- 3.1.2 Model Parameters Estimation45-51
- 3.1.3 Model Decoding51-53
- 3.2 Decision Tree53-54
- 3.3 HTK54-63
- 3.3.1 Data Format Conversion55-58
- 3.3.2 Model Topology Definition58-60
- 3.3.3 Training60
- 3.3.4 HMM Recognition60-63
- 4 Arabic Font Recognition63-73
- 4.1 Preprocessing63-69
- 4.1.1 Flood Fill-based Diacritic Segmentation63-66
- 4.1.2 Clustering-based Diacritics Segmentation66-69
- 4.1.3 Diacritics Validation69
- 4.2 Features Extraction and Classification69-73
- 5 Arabic Optical Character Recognition73-85
- 5.1 System Overview73
- 5.2 Diacritic and Noise Removal73-76
- 5.3 Features Extraction76-78
- 5.4 HMM Recognition78-81
- 5.5 Diacritic Recognition81-82
- 5.6 PAW Recognition82-85
- 6 Experiments and Results85-107
- 6.1 OFR Experimental Results85-96
- 6.1.1 The Database85-86
- 6.1.2 Page Level Font Recognition86-88
- 6.1.3 Line Level Font Recognition88
- 6.1.4 Number of Diacritics Influence88-90
- 6.1.5 Diacritic Class Influence90-92
- 6.1.6 Font Style Recognition92
- 6.1.7 Multi-language Document92
- 6.1.8 Text Orientation92-94
- 6.1.9 Real Data Evaluation94-96
- 6.2 OCR Experimental Results96-104
- 6.2.1 Arabic Printed Text Image(APTI)Database97-100
- 6.2.2 PAW segmentation result100
- 6.2.3 APTI protocols recognition result100-102
- 6.2.4 PAW recognition result102
- 6.2.5 Diacritics recognition result102-103
- 6.2.6 Network influence103-104
- 6.3 Multi-font text recognition104-105
- 6.4 Comparison with previous methods105-107
- 7 Conclusion and Future Directions107-110
- 7.1 Discussion and Conclusion107-108
- 7.2 Future directions108-110
- Acknowledgment110-111
- Bibliography111-118
- Appendix 1 Publications118
【相似文献】
中国期刊全文数据库 前10条
1 许振新;字符识别要面向应用[J];中国计算机用户;2003年13期
2 卢达,浦炜,谢铭培;一种用于提高字符识别速度的字符预分类法研究 [J];计算机工程与应用;2000年04期
3 孙广玲,唐降龙;基于识别结果反馈信息的闭环联机字符识别系统[J];计算机工程与应用;2002年22期
4 乌凌超,莫玉龙;基于独立分量分析的字符识别方法[J];上海大学学报(自然科学版);2003年03期
5 陈薇,李勇;基于块输入的神经网络英语字符识别研究[J];计算机时代;2005年07期
6 汤茂斌;谢渝平;李就好;;基于神经网络算法的字符识别方法研究[J];微电子学与计算机;2009年08期
7 田立岩;胡晓光;;一种改进的快速嵌入式字符识别方法[J];光电子.激光;2010年10期
8 陈默;何小海;吴炜;杨晓敏;付光荣;;结合独立与连续字符识别的集装箱号识别技术[J];四川大学学报(工程科学版);2011年S1期
9 韩林峰;赵晖;;基于支持向量机的联机手写维吾尔字符识别[J];计算机应用与软件;2012年03期
10 宋贤霞;李玉琴;;基于扫描圈的字符识别方法[J];自动化与信息工程;2012年05期
中国重要会议论文全文数据库 前10条
1 汤茂斌;谢渝平;李就好;;基于神经网络算法的字符识别方法研究[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 洪汉玉;郭强;章秀华;张艳;林志敏;;复杂背景条件下字符识别新方法研究[A];第十四届全国图象图形学学术会议论文集[C];2008年
3 车扬;郑智捷;;速记字符识别的预处理模式和方法探讨[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
4 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
5 刘云曼;王磊;;盲人阅读机中图像字符识别方法的研究[A];天津市生物医学工程学会第三十三届学术年会论文集[C];2013年
6 余晓华;陈晓春;刘好炯;;手持式仪表字符识别技术研究[A];《IT时代周刊》论文专版(第300期)[C];2014年
7 陆璐;张旭东;赵莹;高隽;;基于卷积神经网络的车牌照字符识别研究[A];第十二届全国图象图形学学术会议论文集[C];2005年
8 朱小燕;史一凡;马少平;;脱机手写体字符识别研究[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 欧梅芳;宋瑞霞;;V-系统在信息重构与字符识别中的应用探索[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
10 张雪山;田慧;;字符识别系统的一种定位算法[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年
中国重要报纸全文数据库 前3条
1 尼克;计算历史学:大数据时代的读书[N];东方早报;2014年
2 王庆国;票据印刷视觉字符检测系统中硬件的选择[N];中国包装报;2008年
3 方忠诚;OCR技术及其应用[N];北京电子报;2000年
中国博士学位论文全文数据库 前3条
1 罗特飞(Mohammed Lutf);基于HMM与决策树的多字体阿拉伯文的字符识别[D];华中科技大学;2015年
2 文颖;数字、字符识别及其应用研究[D];上海交通大学;2009年
3 彭健;多类小字符集自适应字符识别技术及系统的研究[D];重庆大学;2002年
中国硕士学位论文全文数据库 前10条
1 张佳伟;基因组自动化进化仪的研制[D];浙江大学;2015年
2 邱立松;国际音标字符识别算法的研究[D];上海师范大学;2015年
3 张靖娅;钢板点阵喷印字符识别方法研究[D];沈阳理工大学;2015年
4 武威;基于模板匹配与结构特征的字符识别算法研究[D];郑州大学;2015年
5 王劲松;基于神经网络的字符识别系统的设计与实现[D];电子科技大学;2014年
6 周炳昱;基于手机摄像取词的电子词典的设计与实现[D];大连理工大学;2015年
7 戴威;联机手写智能计算系统的研究[D];华北电力大学;2015年
8 尹少东;基于嵌入式Linux的字符识别[D];河北科技大学;2015年
9 周军;图像中自然场景字符区域定位[D];东北大学;2014年
10 周品;车牌分割和字符识别的算法研究[D];南京邮电大学;2015年
本文关键词:基于HMM与决策树的多字体阿拉伯文的字符识别,由笔耕文化传播整理发布。
本文编号:273555
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/273555.html