基于深度学习的联机蒙古文手写识别系统研究
发布时间:2021-05-06 17:02
当今主流蒙古文输入法的输入方式是基于键盘输入,在产品研发方面已趋于成熟,但是面向手写识别输入方式的蒙古文输入法研究目前仍处于初级阶段。手写识别技术分为联机识别和脱机识别,本文面向智能手机终端开发实现了一套基于深度学习技术的联机蒙古文手写识别系统。本文借鉴汉文、英文等主流语种的联机手写识别模型的理论基础与技术路线,搭建了基于序列到序列(Seq2Seq)框架的联机蒙古文手写识别模型。首先,本文开发了蒙古文手写数据采集系统,通过收集和整理蒙古文手写语料库,最终采用了257800个样本(总词汇量为124401)进行模型训练。其次,本文针对蒙古文手写识别数据的预处理提出了距离夹角方法和坐标标准化方法。最后,基于深度学习技术的联机蒙古文手写识别模型摆脱了数据特征提取的依赖,凭借序列到序列(Seq2Seq)模型强大的建模能力提高了手写识别的性能。实验结果表明,基于Seq2Seq模型的蒙古文整词识别系统正确率达到83.18%,通过数据预处理操作可以减少模型计算量,提高识别效率。最终,本文基于Seq2Seq模型的联机蒙古文手写识别模型搭建了一套完整的蒙古文手写识别服务,通过智能手机终端调用该服务实现了手...
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意义
1.2 相关研究工作
1.2.1 手写识别发展历史和研究现状
1.2.2 联机蒙古文手写识别研究现状
1.3 论文主要内容及组织结构
第二章 联机蒙古文手写识别基线系统搭建
2.1 蒙古文的特点
2.2 联机蒙古文手写识别系统结构
2.3 预处理
2.4 特征提取
2.4.1 切分蒙古文
2.4.2 分类特征
2.4.3 神经网络特征提取
2.5 识别模型
2.5.1 隐马尔可夫模型
2.5.2 CNN+RNN网络结构
2.6 语料库建立
2.7 联机蒙古文手写识别基线实验
2.7.1 划分数据集
2.7.2 后处理
2.7.3 联机蒙古文手写识别评测
2.7.4 结果与分析
2.8 本章小结
第三章 基于注意力的序列到序列建模
3.1 基于Seq2Seq的联机蒙古文手写识别模型
3.1.1 算法描述
3.1.2 注意力机制
3.1.3 解码器与词典
3.2 预处理
3.2.1 距离夹角方法
3.2.2 XY-坐标标准化
3.2.3 生成图片
3.3 实验结果与分析
3.3.1 不同隐藏单元个数对比实验
3.3.2 距离夹角方法处理实验
3.3.3 XY-坐标标准化处理实验
3.3.4 基线实验与Seq2Seq+AM对比实验
3.3.5 不同测试集实验结果分析
3.4 本章小结
第四章 应用服务搭建
4.1 应用服务概述
4.2 框架设计
4.3 服务模块
4.4 联机蒙古文手写识别模块
4.5 测试
4.5.1 功能测试
4.5.2 压力测试
4.6 本文总结
第五章 总结及展望
5.1 本文工作总结
5.2 后续工作展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于TensorFlow深度学习手写体数字识别及应用[J]. 黄睿,陆许明,邬依林. 电子技术应用. 2018(10)
[2]蒙古族语言文字保护问题研究[J]. 那日苏,阿思根. 内蒙古民族大学学报(社会科学版). 2013(01)
[3]软件测试方法概述[J]. 张新华,何永前. 科技视界. 2012(04)
[4]Web应用程序压力测试[J]. 姜昌华,朱敏,陈优广. 计算机应用. 2003(10)
硕士论文
[1]基于深度学习的蒙古语语音识别声学模型研究[D]. 王勇和.内蒙古大学 2018
[2]基于Web的大创项目管理系统的设计与实现[D]. 廖鹏宇.大连理工大学 2015
[3]基于蒙古文标准编码的输入算法的优化、实现与分析[D]. 刘瑾.内蒙古大学 2014
[4]基于深度学习的图像检索研究[D]. 马冬梅.内蒙古大学 2014
[5]基于MVC模式的Web软件系统开发框架设计与实现[D]. 刘欣.山东大学 2013
[6]联机手写蒙古文字识别技术的研究[D]. 白文荣.内蒙古大学 2007
[7]联机手写蒙古文字识别技术的研究与实现[D]. 吴伟.内蒙古大学 2005
本文编号:3172296
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意义
1.2 相关研究工作
1.2.1 手写识别发展历史和研究现状
1.2.2 联机蒙古文手写识别研究现状
1.3 论文主要内容及组织结构
第二章 联机蒙古文手写识别基线系统搭建
2.1 蒙古文的特点
2.2 联机蒙古文手写识别系统结构
2.3 预处理
2.4 特征提取
2.4.1 切分蒙古文
2.4.2 分类特征
2.4.3 神经网络特征提取
2.5 识别模型
2.5.1 隐马尔可夫模型
2.5.2 CNN+RNN网络结构
2.6 语料库建立
2.7 联机蒙古文手写识别基线实验
2.7.1 划分数据集
2.7.2 后处理
2.7.3 联机蒙古文手写识别评测
2.7.4 结果与分析
2.8 本章小结
第三章 基于注意力的序列到序列建模
3.1 基于Seq2Seq的联机蒙古文手写识别模型
3.1.1 算法描述
3.1.2 注意力机制
3.1.3 解码器与词典
3.2 预处理
3.2.1 距离夹角方法
3.2.2 XY-坐标标准化
3.2.3 生成图片
3.3 实验结果与分析
3.3.1 不同隐藏单元个数对比实验
3.3.2 距离夹角方法处理实验
3.3.3 XY-坐标标准化处理实验
3.3.4 基线实验与Seq2Seq+AM对比实验
3.3.5 不同测试集实验结果分析
3.4 本章小结
第四章 应用服务搭建
4.1 应用服务概述
4.2 框架设计
4.3 服务模块
4.4 联机蒙古文手写识别模块
4.5 测试
4.5.1 功能测试
4.5.2 压力测试
4.6 本文总结
第五章 总结及展望
5.1 本文工作总结
5.2 后续工作展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于TensorFlow深度学习手写体数字识别及应用[J]. 黄睿,陆许明,邬依林. 电子技术应用. 2018(10)
[2]蒙古族语言文字保护问题研究[J]. 那日苏,阿思根. 内蒙古民族大学学报(社会科学版). 2013(01)
[3]软件测试方法概述[J]. 张新华,何永前. 科技视界. 2012(04)
[4]Web应用程序压力测试[J]. 姜昌华,朱敏,陈优广. 计算机应用. 2003(10)
硕士论文
[1]基于深度学习的蒙古语语音识别声学模型研究[D]. 王勇和.内蒙古大学 2018
[2]基于Web的大创项目管理系统的设计与实现[D]. 廖鹏宇.大连理工大学 2015
[3]基于蒙古文标准编码的输入算法的优化、实现与分析[D]. 刘瑾.内蒙古大学 2014
[4]基于深度学习的图像检索研究[D]. 马冬梅.内蒙古大学 2014
[5]基于MVC模式的Web软件系统开发框架设计与实现[D]. 刘欣.山东大学 2013
[6]联机手写蒙古文字识别技术的研究[D]. 白文荣.内蒙古大学 2007
[7]联机手写蒙古文字识别技术的研究与实现[D]. 吴伟.内蒙古大学 2005
本文编号:3172296
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3172296.html
最近更新
教材专著