汉字识别关键算法研究与应用

发布时间:2017-12-24 09:01

  本文关键词:汉字识别关键算法研究与应用 出处:《浙江大学》2017年硕士论文 论文类型:学位论文


  更多相关文章: 汉字识别 中国书法 特征过滤 特征提取 神经网络 移动平台


【摘要】:汉字和书法是中国传统文化重要组成部分,构成丰富多彩的中国历史与文化。用户在浏览欣赏汉字书籍时,特别是在浏览欣赏有诸多繁体字的古代书籍的时候,会遇到很多生疏不认识的汉字,给用户欣赏作品带来了障碍。如果有工具能够帮助用户识别对应的汉字并给出该汉字的读音等相关信息,将给用户阅读书籍带来很大帮助和便利。针对上述问题,本文首先提出了一种基于GIST特征、SIFT特征和SSC(相似性敏感编码)的汉字识别算法。对于汉字图像的特征表达,目前最广泛使用的全局特征和局部特征分别是GIST特征和SIFT特征,本文使用GIST特征和SIFT特征相结合的形式以提高识别的准确率。首先,通过爬虫技术搜集目前所有的汉字,建立汉字库。然后利用图像切割技术获取每个汉字的图像,并提取特征建立汉字图像特征库。由于特征库存储空间较大,本文通过对SIFT特征过滤和SSC算法,对特征库进行压缩,减少特征库存储。此外,为了提高识别的时间效率,本文采用了高维空间索引算法,对比实验选取合适的索引算法以减少识别过程中时间消耗,增强识别算法的拓展性。相对于汉字识别,书法字形式的多样性使得书法字识别更加困难。最后,本文尝试将深度学习与传统识别方法相结合的方法进行书法字图像的识别。从书法的风格多样性的角度出发,利用深度卷积神经网络对书法字图像进行风格上的分类,然后通过传统的分类算法识别该书法字图像,得到其对应的汉字。通过实验对比,本文提出的书法字识别算法更高效。最后,本文从图像的特征提取、特征匹配和系统架构三个层面出发,在Windows和Android平台下设计实现了基于GIST特征、SIFT特征SSC压缩算法的汉字识别应用,能够方便用户识别印刷体简繁汉字。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41

【参考文献】

相关期刊论文 前1条

1 王赓;;脱机手写体汉字识别技术研究[J];成功(教育);2008年12期



本文编号:1327696

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1327696.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b30bf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com