当前位置:主页 > 科技论文 > 软件论文 >

基于深度学习的蒙古文标准符合性检测系统的设计与实现

发布时间:2022-11-05 01:22
  目前蒙古文信息标准化体系正在构建,而蒙古文的标准符合性检测工具仅仅只有两个,其一系统采用的是提取印刷体白体蒙古文的特征并对其进行相似度的计算,通过人工设定一个固定阈值来判断被测字样与国家标准字样是否一致;其二系统主要是以人工鉴别的方法来判断给定字样与国家标准字样是否一样。上述这两种检测系统各有利弊,但都在不同程度上填补了蒙古文标准符合性检测工具的空白。由于它们在实际应用中的效率并不高,而且都难以推动已发布的蒙古文信息技术标准的实施。所以为了解决上述这种问题,本文通过对蒙古文的标准符合性检测进行了相关的调研后,实现了基于深度学习的蒙古文标准符合性检测系统,为蒙古文的信息标准化建设做出了一点贡献。本文的主要研究内容包含以下几点:(1)构建了基于国家标准的传统蒙古文编码符合性检测的数据集。先将待测的编码序列存储在txt文件中,进行不同字体的切换,同时人工截取相应区域的图片,将图片通过OCR技术把蒙古文单词切分出来,再将得到的目标图片逆时针旋转90°并进行保存,经过上述操作后再通过人工校的方式把符合国家标准的字符图像存放入训练集中。由于已出版的字库文件很少,所以构建出的数据集是一个小型数据集,... 

【文章页数】:90 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 引言
    1.1 课题研究的背景和意义
    1.2 课题研究的现状
    1.3 本文研究内容及创新点
    1.4 本文的组织结构
第二章 相关理论与技术
    2.1 字库、字体及编码
        2.1.1 字库
        2.1.2 字体、字形及字型
        2.1.3 字符集及编码
    2.2 复杂文本布局引擎的介绍
        2.2.1 Uniscribe复杂文本布局引擎
        2.2.2 HarfBuzz复杂文本布局引擎
    2.3 字符图像的获取及预处理
        2.3.1 从字库中获取图像
        2.3.2 字符图像的预处理
    2.4 卷积神经网络
        2.4.1 卷积神经网络的概述
        2.4.2 卷积神经网络的特性
        2.4.3 卷积层
        2.4.4 池化层
        2.4.5 全连接层
        2.4.6 卷积神经网络的整体结构
    2.5 经典的卷积神经网络模型
        2.5.1 LeNet-5
        2.5.2 AlexNet
    2.6 神经网络的训练
        2.6.1 训练过程
        2.6.2 代价函数
        2.6.3 正则化
        2.6.4 随机梯度下降法
        2.6.5 参数初始化
    2.7 实验评价标准
    2.8 本章小结
第三章 传统蒙古文及相关标准的介绍
    3.1 传统蒙古文语言文字的介绍
    3.2 传统蒙古文单词的构成
    3.3 蒙古文国家标准编码
    3.4 蒙古文信息技术标准的发展情况
    3.5 本章小结
第四章 构建数据集及实验环境的介绍
    4.1 实验数据集来源
    4.2 数据集的构建
        4.2.1 数据的生成
        4.2.2 图像尺寸归一化
        4.2.3 不平衡数据集和小型数据集的解决
    4.3 实验环境介绍
        4.3.1 实验硬件条件介绍
        4.3.2 实验软件条件介绍
    4.4 本章小结
第五章 基于深度学习的蒙古文编码字符集标准符合性检测
    5.1 蒙古文编码字符集标准符合性检测原理
    5.2 基于LeNet-5的蒙古文编码字符集标准符合性检测识别模型
    5.3 改进基于LeNet-5的蒙古文编码字符集标准符合性检测识别模型
    5.4 基于AlexNet的蒙古文编码字符集标准符合性检测识别模型
    5.5 实验与结果分析
        5.5.1 三个识别模型在验证集的实验结果
        5.5.2 三个字库的蒙古文编码字符集的实验结果
        5.5.3 三个字库的蒙古文编码字符集具体的实验结果
    5.6 蒙古文编码符合性检测系统界面
    5.7 本章小结
第六章 基于深度学习的蒙古文转换规则标准符合性检测
    6.1 蒙古文转换规则标准符合性检测原理
    6.2 基于LeNet-5的蒙古文转换规则标准符合性识别模型
    6.3 改进基于LeNet-5的蒙古文转换规则标准符合性检测识别模型
    6.4 基于AlexNet的蒙古文编码字符集标准符合性检测识别模型
    6.5 实验与结果分析
        6.5.1 三个识别模型在验证集的实验结果
        6.5.2 三个字库的蒙古文转换规则的实验结果
        6.5.3 三个字库的蒙古文转换规则具体的实验结果
    6.6 蒙古文转换规则标准符合性检测系统界面
    6.7 本章小结
第七章 基于深度学习的蒙古文资源标准符合性检测
    7.1 蒙古文资源标准符合性检测原理
    7.2 基于LeNet-5的蒙古文资源标准符合性检测识别模型
    7.3 改进基于LeNet-5的蒙古文资源标准符合性检测识别模型
    7.4 基于AlexNet的蒙古文资源标准符合性检测识别模型
    7.5 实验与结果分析
        7.5.1 三个识别模型在验证集的实验结果
        7.5.2 三个字库的蒙古文资源的实验结果
        7.5.3 三个字库的蒙古文资源具体的实验结果
    7.6 蒙古文资源标准符合性检测系统界面
    7.7 本章小结
第八章 总结与展望
    8.1 本文工作总结
    8.2 未来工作展望
参考文献
致谢
附录


【参考文献】:
期刊论文
[1]蒙古文复杂文本布局引擎的标准符合性测试[J]. 呼斯勒,白双成,确精扎布.  广西科学院学报. 2018(01)
[2]基于机器学习的行人检测[J]. 陶峥嵘.  电子技术. 2017(06)
[3]贯彻落实蒙古文信息技术国家标准的思考[J]. 六十三.  信息技术与标准化. 2015(Z1)
[4]完善蒙古文编码标准的思考和建议[J]. 孟和吉雅,巩政.  信息技术与标准化. 2015(Z1)
[5]蒙古文软件标准符合性检测的研究与设计[J]. 何正安,王欣,陈海.  信息技术与标准化. 2015(Z1)
[6]印刷体蒙古文文字识别的研究[J]. 春花.  内蒙古民族大学学报(自然科学版). 2014(06)
[7]维哈柯文字库标准符合性检测[J]. 单艳,蔡李,董军,李晓.  信息技术与标准化. 2011(06)
[8]蒙古文整词输入法的设计与实现[J]. 白云莉.  内蒙古农业大学学报(自然科学版). 2008(03)
[9]藏文字库标准符合性自动检测方案设计与实现[J]. 刘瀚猛,芮建武,白真龙,吴健.  中文信息学报. 2008(03)
[10]藏文软件标准符合性检测的研究与设计[J]. 何正安,王欣,代红.  信息技术与标准化. 2007(08)

硕士论文
[1]基于词典与HMM相结合的蒙古文最小词素编码到标准编码的转换研究[D]. 许杨.内蒙古大学 2018
[2]基于深度学习的蒙古文古籍整词识别技术研究[D]. 刘鑫.内蒙古大学 2018
[3]“自下而上”的传统蒙古文简单句句法分析研究与实现[D]. 乌日恒.内蒙古大学 2017
[4]多种蒙古文编码自动识别方法的研究[D]. 李倩.内蒙古大学 2014
[5]蒙古文信息处理产品标准符合性检测系统的设计与实现[D]. 赵颖霞.内蒙古大学 2013
[6]中国蒙古文信息处理技术发展历程研究[D]. 白喜文.内蒙古师范大学 2012
[7]字库标准符合性检测技术的研究[D]. 汪远平.内蒙古大学 2012
[8]多语言电子词典构建[D]. 何向真.西北民族大学 2010
[9]多字体印刷蒙文字识别技术的研究[D]. 李伟.内蒙古大学 2004



本文编号:3701658

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3701658.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户075fe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com