基于卷积神经网络的东巴文字分类与识别
发布时间:2020-12-13 10:35
字符识别是集模式识别、图像处理和文字处理技术相结合的一种技术,是人工智能和模式识别领域一个重要的分支。通过多年的研究和探索,字符识别在英、德、拉丁语等西方文字和汉字的识别研究中已取得令人满意的结果。东巴文字作为唯一仍在使用的象形文字,具有独特的历史价值和丰富的文化内涵,但对东巴文字的分类识别工作起步较晚,研究还不够深入。字符识别领域内经常采用特征提取法加分类器的传统方法进行研究,这种方法依靠具体算法来提取文字特征,提取特征算法针对性太强,泛化性差。卷积神经网络的出现将特征提取简单化,网络能够从海量数据中自动提取到有效特征,因此在字符识别领域的研究迅速取得了巨大的进展。本文结合图像处理和数据增强,提出基于卷积神经网络的东巴文字分类与识别的方法。本文所做的工作如下:(1)针对东巴文字数据集较少的问题,首先结合东巴古籍和东巴文字输入法构造原始数据集;然后通过二值化、字符分割和归一化等图像预处理,将图像拆分成便于研究的单个东巴文字;最后运用数据增强的方法,利用衍射变换和噪声抖动等对原始数据集进行了扩充,将原始数据集从956张扩充至30592张。(2)针对人工构造的东巴文字数据集,采用四种不同卷...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1.1字符识别的分类??
类算法提取字符某种特征,如纹理特征、拓扑特征、网格特征等;二是利用分类器??对获取的特征进行分类,如决策树、SVM、K-means算法等。但这种传统的方法有??几类通病:一方面大部分实际应用的特征都不具有通用性,在复杂情况下(如图1.2??所示),很多特征几乎无效甚至无法提取如笔画、结构、边缘特征等;另一方面,??根据不同字符的特点来定义和提取不同特征也是一件极为耗时耗力的工作。近年??来,随着深度学习的兴起,卷积神经网络凭借强大的特征提取能力在字符识别领域??有了广泛的研究和应用。??誦??图1.2复杂条件下的字符??字符识别技术己经逐步融入日常学习、生活、工作等各个领域,广泛应用于金??融、保险、税务、工商等行业。字符识别当前的一些主要应用如下:??(1)车牌识别??随着我国经济发展,机动车辆的数量爆炸式增长,带来了越来越多的交通压力??和交通安全隐患。随着智能城市、智能交通概念的提出,车牌识别系统在道路监管、??卡口、停车场等场景下发挥着重要的作用,如高速ETC,违章检测、无人值守停车??场等。图1.3展示了车牌识别的应用场景。??2??
联网时代后,人们的生活越来越离不开手机,各类证件、银行卡的电子化需求越来??越迫切。运用字符识别技术的证件识别即可实现采集图像并提取证件、银行卡的有??效信息,如图1.?4所示。??.——了工—??7〇1[??f.?WWR???*?■嫌:????,?,—??产?'???.:?=签??,(?;?v?-?直??y?一身*w钃…撕^:細教冷?r?t??厂—?LlJ?L一??*'—?1?^?.、???^??..if?^T..:::??图1.4身份证识别??3??
【参考文献】:
期刊论文
[1]东巴经典古籍象形文字智能识别研究[J]. 吴国新,丁春艳,徐小力,王宁. 电子测量与仪器学报. 2016(11)
[2]基于支持向量机的纳西东巴象形文字符识别[J]. 王海燕,王红军,徐小力. 云南大学学报(自然科学版). 2016(05)
[3]从东巴文与图片、汉字的分类比较看东巴文的性质——来自行为和眼动研究的证据[J]. 和秀梅,张积家. 华南师范大学学报(社会科学版). 2016(01)
[4]基于弹性网格混合特征的脱机手写维文识别[J]. 贾建忠,龚声蓉,衣马木艾山·阿布都力克木. 计算机应用与软件. 2014(09)
[5]浅谈OCR技术的发展和应用[J]. 王文华. 福建电脑. 2012(06)
[6]关于少数民族文字文献的数字化思考[J]. 包和平. 图书馆论坛. 2004(06)
[7]光学字符识别技术与展望[J]. 荆涛,王仲. 计算机工程. 2003(02)
[8]甲骨文自动识别的图论方法[J]. 李锋,周新伦. 电子科学学刊. 1996(S1)
博士论文
[1]东巴文异体字研究[D]. 周斌.华东师范大学 2004
硕士论文
[1]基于深度学习的字符识别[D]. 张超群.电子科技大学 2016
[2]基于内容的秦汉瓦当小篆文字识别方法研究[D]. 刘磊.西北大学 2015
本文编号:2914409
【文章来源】:云南大学云南省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1.1字符识别的分类??
类算法提取字符某种特征,如纹理特征、拓扑特征、网格特征等;二是利用分类器??对获取的特征进行分类,如决策树、SVM、K-means算法等。但这种传统的方法有??几类通病:一方面大部分实际应用的特征都不具有通用性,在复杂情况下(如图1.2??所示),很多特征几乎无效甚至无法提取如笔画、结构、边缘特征等;另一方面,??根据不同字符的特点来定义和提取不同特征也是一件极为耗时耗力的工作。近年??来,随着深度学习的兴起,卷积神经网络凭借强大的特征提取能力在字符识别领域??有了广泛的研究和应用。??誦??图1.2复杂条件下的字符??字符识别技术己经逐步融入日常学习、生活、工作等各个领域,广泛应用于金??融、保险、税务、工商等行业。字符识别当前的一些主要应用如下:??(1)车牌识别??随着我国经济发展,机动车辆的数量爆炸式增长,带来了越来越多的交通压力??和交通安全隐患。随着智能城市、智能交通概念的提出,车牌识别系统在道路监管、??卡口、停车场等场景下发挥着重要的作用,如高速ETC,违章检测、无人值守停车??场等。图1.3展示了车牌识别的应用场景。??2??
联网时代后,人们的生活越来越离不开手机,各类证件、银行卡的电子化需求越来??越迫切。运用字符识别技术的证件识别即可实现采集图像并提取证件、银行卡的有??效信息,如图1.?4所示。??.——了工—??7〇1[??f.?WWR???*?■嫌:????,?,—??产?'???.:?=签??,(?;?v?-?直??y?一身*w钃…撕^:細教冷?r?t??厂—?LlJ?L一??*'—?1?^?.、???^??..if?^T..:::??图1.4身份证识别??3??
【参考文献】:
期刊论文
[1]东巴经典古籍象形文字智能识别研究[J]. 吴国新,丁春艳,徐小力,王宁. 电子测量与仪器学报. 2016(11)
[2]基于支持向量机的纳西东巴象形文字符识别[J]. 王海燕,王红军,徐小力. 云南大学学报(自然科学版). 2016(05)
[3]从东巴文与图片、汉字的分类比较看东巴文的性质——来自行为和眼动研究的证据[J]. 和秀梅,张积家. 华南师范大学学报(社会科学版). 2016(01)
[4]基于弹性网格混合特征的脱机手写维文识别[J]. 贾建忠,龚声蓉,衣马木艾山·阿布都力克木. 计算机应用与软件. 2014(09)
[5]浅谈OCR技术的发展和应用[J]. 王文华. 福建电脑. 2012(06)
[6]关于少数民族文字文献的数字化思考[J]. 包和平. 图书馆论坛. 2004(06)
[7]光学字符识别技术与展望[J]. 荆涛,王仲. 计算机工程. 2003(02)
[8]甲骨文自动识别的图论方法[J]. 李锋,周新伦. 电子科学学刊. 1996(S1)
博士论文
[1]东巴文异体字研究[D]. 周斌.华东师范大学 2004
硕士论文
[1]基于深度学习的字符识别[D]. 张超群.电子科技大学 2016
[2]基于内容的秦汉瓦当小篆文字识别方法研究[D]. 刘磊.西北大学 2015
本文编号:2914409
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2914409.html