当前位置:主页 > 科技论文 > 软件论文 >

汉字细化算法的研究

发布时间:2020-03-14 04:24
【摘要】:随着计算机技术的快速发展,汉字识别技术也逐渐成熟,被应用于许多领域,如信件的智能分拣、稿件校对、笔迹鉴定、文档图像处理等。而细化算法是汉字识别预处理中最重要的技术之一,也一直是脱机汉字识别的瓶颈,因此本文重点研究汉字的细化算法。本文在研究实现已有算法的基础上,重点提出了若干改进算法,论文主要工作如下。(1)研究了细化前对图像的预处理,重点研究了基于纵横向积分法和区域扩张法两种方法的字切分最小包围盒算法。在纵横向积分法中提出对积分曲线应用小波变换进行平滑处理,提高了列、字切分的准确度。实验表明采用两种方法较好地实现了字符切分。接着,研究了 Z-S细化算法,最大圆盘骨架提取算法、基于数学形态学的细化算法、基于索引表的细化算法以及A-W细化算法等,重点研究实现了这些算法并比较其优缺点。(2)虽然A-W细化算法优于上述其他方法的细化结果,但仍存在非单像素问题、分叉点处畸变和毛刺等缺陷。基于邻接矩阵的单像素化处理算法对于笔画撇、捺的处理效果不理想,而基于模板匹配的单像素化处理算法对笔画撇、捺处理效果好,对交叉点处处理效果不佳,提出将这两种方法结合起来的新方法CEADAR(Combination of template matching and adjacency matrix),消除了可能存在的两像素宽的骨架,达到了良好效果;接着,针对A-W细化算法的不足,提出基于笔画走向预测的A-W细化改进算法,对于满足A-W删除条件的点,判断其笔画走向并优先保留横、竖、撇、捺四个笔画走向上的点,实验结果表明此算法改善了交叉点处畸变的现象。(3)提出一种骨架畸变的矫正算法。检测骨架上的特征点,针对最大圆算法在笔画连接后骨架会出现不平滑的现象,采用改进的最大圆方法进行分叉点合并以及局部笔画的重新连接,提出结合汉字结构知识规则来优化局部笔画的连接,可获得更优的效果。实验结果表明以上改进算法得到的细化结果是单像素而且无毛刺和分叉点的,在书法字库和宋体、楷体、黑体、隶书等数据集上均取得了良好的细化结果。
【图文】:

字体,汉字


性思想与文化的交流和继承,成为中华民族最宏伟的文化宝藏。与此同时,经过的发展与积淀,它具有了很多艺术特征和价值。党的 十八大 提出 文化强国 的计算机来研究汉字艺术具有重要的价值和实际意义。现代电子科技技术的飞速发展,,引发人们 提笔忘字 的现象越来越严重。而《中写大会》《汉字英雄》等节目的热播也进一步说明了人们对汉字文化的巨大需求技的发展,需要在智能设备中实现汉字的智能化识别。汉字的智能化识别正在成活中不可或缺的一种输入方式,单纯的键盘鼠标输入技术已经不能满足人们的离线字符识别依旧是难点和重点。在这些工作中,字体骨架的提取起到了至关重,其中,基于骨架相似性的字符检索与识别[1]主要是利用提取的骨架的全局和局通过特征向量进行相似度计算。但由于汉字本身具有的几个特点,使得汉字识别。(1) 汉字字体多样汉字有很多种不同的字体,例如,常用的楷体、宋体、隶书、黑体,更不用法作品中各种风格的字体都有可能出现。图 1-1 展示了四种比较常见字体书写的字。可以看出,四种字形各具特色。

二值化阈值


图像二值化的二值化处理实际上就是区分图像中的 前景目标 和 背景 ,从灰度最基本的方法就是基于图像灰度分布的阈值方法[36]。阈值方法的核心。的选取是图像二值化的关键,一个恰当的阈值会得到效果较好的二值大或太小,都会导致目标信息的丢失,从而达不到分辨的效果。因此将图像背景和目标分离的关键,从图像中获得最大信息量。副灰度图像中,用 表示图像在像素点 处的灰度值,用 g (i , , 为二值图像, 的取值范围是 0~255,设选取的阈值是 T 1, ( , )0, ( , )f i j Tg i, jf i j T 不同的阈值得到的结果会相差很多,如图 2-2 所示。当选择的阈值太全将背景过滤掉,导致目标文字与背景不能区分开。当选择的阈值太较深的部分目标文字会被归为背景,仍然不能将背景与目标清晰的分息。这个例子中我们最终选择了 T=200,效果如图所示。
【学位授予单位】:西安理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41

【参考文献】

相关期刊论文 前10条

1 李文杰;何家峰;;一种改进的A-W细化算法[J];计算机工程;2012年06期

2 侯立斐;张静;霍玲玲;;一种改进的汉字骨架提取算法[J];微型机与应用;2011年17期

3 廖志武;;2-D骨架提取算法研究进展[J];四川师范大学学报(自然科学版);2009年05期

4 俞凯;吴江琴;庄越挺;;基于骨架相似性的书法字检索[J];计算机辅助设计与图形学学报;2009年06期

5 苗晋诚;;基于骨架化、骨架划分获取书法汉字结构特征方法[J];昆明理工大学学报(理工版);2008年03期

6 唐瑶;张锡哲;王钲旋;;一种中国书法作品的骨架提取算法[J];工程图学学报;2006年05期

7 王建平;钱自拓;王金玲;罗国军;;基于数学形态学的图像汉字笔划细化和提取[J];合肥工业大学学报(自然科学版);2005年11期

8 赵春江,施文康,邓勇;具有鲁棒性的图像骨架提取方法[J];计算机应用;2005年06期

9 陈力,丁晓青;基于小波特征的单字符汉字字体识别[J];电子学报;2004年02期

10 吕俊白;一种有效的二值图像细化算法[J];计算机工程;2003年18期

相关会议论文 前1条

1 王燕妮;周明全;武仲科;敖雪峰;戴莉;周曼;;一种改进的中国书法骨架提取算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年

相关博士学位论文 前1条

1 俞凯;计算机书法若干关键技术研究[D];浙江大学;2010年

相关硕士学位论文 前2条

1 张静;骨架提取算法研究与应用[D];辽宁师范大学;2012年

2 赵琪;书法碑帖文字的笔划提取技术及其实现[D];华东师范大学;2010年



本文编号:2586902

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2586902.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户357d4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com