基于纹理特征的多文种文档图像文种识别研究
发布时间:2022-01-24 02:54
随着信息时代的到来,在数字化大环境中,越来越多的资源以文本图像的形式保存。在全球化的进程中,国家之间交流日益频繁,在海量的信息处理过程中,光学字符识别技术(Optical Character Recognition,OCR)得到广泛应用。文种识别技术是OCR前端处理步骤,同样也是文本图像分析的一个重要环节,已经成为一个研究热点。文种识别的研究从1990年开始至今,已经取得不少具有重要价值的成果,大部分研究的数据库都只包含部分地区的文字,数据量少,不能确定适用于更多的文种。鉴于文种识别方法存在的一些问题,本文建立了多文种文档图像数据库,文种的选取包含全球通用文种、中亚文种和国内少数民族文字,具有普遍适用性。本文针对多文种文档图像的文种识别技术进行了相关研究。针对不同语言文字的构造特征、笔画书写特征、空间分布等存在一系列差异,在文档图像中所表现的就是不同的纹理特征,本文提出了基于离散曲波变换的文种识别方法和基于HOG特征的多文种文档图像文种识别方法。为提高单一纹理特征的文种查全率,提出了基于曲波变换纹理特征融合的文种识别方法。本文所做的主要工作如下:1.简述了文种识别领域的研究发展,总结了...
【文章来源】:新疆大学新疆维吾尔自治区 211工程院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
OCR系统
新疆大学硕士学位论文3图1.2 中文样本和对应的灰度统计直方图图1.3 英文样本和对应的灰度统计直方图从图 1.2 和图 1.3 对比可以看出,不同文种文字笔画结构差异明显,其对应的文本图像的灰度统计直方图有存在很大的差异。图像的纹理是它的灰度统计、结构、空间分布等多种信息的综合体现,这些综合信息在机器视觉和模式识别等领域应用普及,是非常重要的图像特征。因此,提取多文种文档图像的纹理特征用作分类特征向量,在实现多文种文档图像文种识别方向可以取得很好地效果。1.3 文档图像文种识别研究现状多文种文档图像文种识别是一个综合性学科,所需要的知识涉及面广泛。文种识别是把不同的语言文字文档图像实现智能识别分类,使 OCR 系统实现自动化,代替人为识别文字种类的过程,提高系统工作效率。A.L.Spitz 在 1990 年第一次发表了关于文种识别领域的学术论文
3图1.2 中文样本和对应的灰度统计直方图图1.3 英文样本和对应的灰度统计直方图从图 1.2 和图 1.3 对比可以看出,不同文种文字笔画结构差异明显,其对应的文本图像的灰度统计直方图有存在很大的差异。图像的纹理是它的灰度统计、结构、空间分布等多种信息的综合体现,这些综合信息在机器视觉和模式识别等领域应用普及,是非常重要的图像特征。因此,提取多文种文档图像的纹理特征用作分类特征向量,在实现多文种文档图像文种识别方向可以取得很好地效果。1.3 文档图像文种识别研究现状多文种文档图像文种识别是一个综合性学科,所需要的知识涉及面广泛。文种识别是把不同的语言文字文档图像实现智能识别分类,使 OCR 系统实现自动化,代替人为识别文字种类的过程,提高系统工作效率。A.L.Spitz 在 1990 年第一次发表了关于文种识别领域的学术论文
【参考文献】:
期刊论文
[1]纹理特征加权融合的中亚多文种文档图像文种识别[J]. 布阿加姑丽·米吉提,库尔班·吾布力,努尔毕亚·亚地卡尔,吐尔根·依不拉因,阿力木江·艾沙. 计算机工程与应用. 2017(20)
[2]基于统计专用字符的维、哈、柯文文种识别研究[J]. 买买提依明·哈斯木,吾守尔·斯拉木,维尼拉·木沙江,努尔麦麦提·尤鲁瓦斯. 中文信息学报. 2015(02)
[3]基于高斯衍生滤波器组的文种识别算法[J]. 童莉,周林,平西建,徐森. 数据采集与处理. 2014(05)
[4]基于小波统计特征的行块级朝汉文种辨识[J]. 金璟璇,崔荣一,崔旭. 延边大学学报(自然科学版). 2013(04)
[5]基于多特征融合的东亚文种识别[J]. 王刚,靳彦青,刘立柱,储瑞来. 计算机科学. 2013(01)
[6]基于多小波变换的文本图像文种识别[J]. 顾立娟,刘才斌,吴勇,郝玉保. 电子设计工程. 2011(15)
[7]基于文字笔画方向直方图的文本图像文种识别[J]. 郭龙,平西建,周林. 信息工程大学学报. 2011(02)
[8]一种采用小波包分析及RBFN的民族文种识别方法[J]. 郭海,赵晶莹,韦宗伟. 计算机工程与科学. 2010(08)
[9]基于特征融合的脱机中文笔迹鉴别[J]. 鄢煜尘,陈庆虎,袁凤,邓伟. 模式识别与人工智能. 2010(02)
[10]基于二元树复数小波变换的文种自动识别[J]. 朱华光,平西建,程娟. 数据采集与处理. 2008(06)
本文编号:3605694
【文章来源】:新疆大学新疆维吾尔自治区 211工程院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
OCR系统
新疆大学硕士学位论文3图1.2 中文样本和对应的灰度统计直方图图1.3 英文样本和对应的灰度统计直方图从图 1.2 和图 1.3 对比可以看出,不同文种文字笔画结构差异明显,其对应的文本图像的灰度统计直方图有存在很大的差异。图像的纹理是它的灰度统计、结构、空间分布等多种信息的综合体现,这些综合信息在机器视觉和模式识别等领域应用普及,是非常重要的图像特征。因此,提取多文种文档图像的纹理特征用作分类特征向量,在实现多文种文档图像文种识别方向可以取得很好地效果。1.3 文档图像文种识别研究现状多文种文档图像文种识别是一个综合性学科,所需要的知识涉及面广泛。文种识别是把不同的语言文字文档图像实现智能识别分类,使 OCR 系统实现自动化,代替人为识别文字种类的过程,提高系统工作效率。A.L.Spitz 在 1990 年第一次发表了关于文种识别领域的学术论文
3图1.2 中文样本和对应的灰度统计直方图图1.3 英文样本和对应的灰度统计直方图从图 1.2 和图 1.3 对比可以看出,不同文种文字笔画结构差异明显,其对应的文本图像的灰度统计直方图有存在很大的差异。图像的纹理是它的灰度统计、结构、空间分布等多种信息的综合体现,这些综合信息在机器视觉和模式识别等领域应用普及,是非常重要的图像特征。因此,提取多文种文档图像的纹理特征用作分类特征向量,在实现多文种文档图像文种识别方向可以取得很好地效果。1.3 文档图像文种识别研究现状多文种文档图像文种识别是一个综合性学科,所需要的知识涉及面广泛。文种识别是把不同的语言文字文档图像实现智能识别分类,使 OCR 系统实现自动化,代替人为识别文字种类的过程,提高系统工作效率。A.L.Spitz 在 1990 年第一次发表了关于文种识别领域的学术论文
【参考文献】:
期刊论文
[1]纹理特征加权融合的中亚多文种文档图像文种识别[J]. 布阿加姑丽·米吉提,库尔班·吾布力,努尔毕亚·亚地卡尔,吐尔根·依不拉因,阿力木江·艾沙. 计算机工程与应用. 2017(20)
[2]基于统计专用字符的维、哈、柯文文种识别研究[J]. 买买提依明·哈斯木,吾守尔·斯拉木,维尼拉·木沙江,努尔麦麦提·尤鲁瓦斯. 中文信息学报. 2015(02)
[3]基于高斯衍生滤波器组的文种识别算法[J]. 童莉,周林,平西建,徐森. 数据采集与处理. 2014(05)
[4]基于小波统计特征的行块级朝汉文种辨识[J]. 金璟璇,崔荣一,崔旭. 延边大学学报(自然科学版). 2013(04)
[5]基于多特征融合的东亚文种识别[J]. 王刚,靳彦青,刘立柱,储瑞来. 计算机科学. 2013(01)
[6]基于多小波变换的文本图像文种识别[J]. 顾立娟,刘才斌,吴勇,郝玉保. 电子设计工程. 2011(15)
[7]基于文字笔画方向直方图的文本图像文种识别[J]. 郭龙,平西建,周林. 信息工程大学学报. 2011(02)
[8]一种采用小波包分析及RBFN的民族文种识别方法[J]. 郭海,赵晶莹,韦宗伟. 计算机工程与科学. 2010(08)
[9]基于特征融合的脱机中文笔迹鉴别[J]. 鄢煜尘,陈庆虎,袁凤,邓伟. 模式识别与人工智能. 2010(02)
[10]基于二元树复数小波变换的文种自动识别[J]. 朱华光,平西建,程娟. 数据采集与处理. 2008(06)
本文编号:3605694
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3605694.html
最近更新
教材专著