基于音节切分的藏文乌金印刷体识别技术研究
发布时间:2023-03-20 03:53
文字识别过程是集模式识别、图像处理和文字处理相结合的一种技术。藏文印刷体识别是藏文信息处理的重要组成部分,这种技术能成倍节约藏文字录入、编辑和处理等工作成本。对藏文相关新闻出版印刷业、办公自动化、古籍资料的整理和数字图书馆等领域有重要的应用价值。与其它文字相比,藏文具有横向字丁间距紧密和纵向字丁层数不同的音节结构特征,而且音节分类数目众多,这对藏文印刷体识别研究带来了挑战。传统的藏文印刷体识别是以藏文字丁为分割单位,采用规则与统计相结合的识别方法。随着信息技术的进步和发展,神经网络模型在图像识别领域取得了巨大的成功,这类模型可以在大规模数据集上,学习更长分割单位的结构特征,能够有效提高识别系统的性能。因此,本文以藏文乌金字体为研究对象,展开了藏文音节为识别单位的研究工作。主要完成了如下工作:1.本论文为了解决训练图像与标签对齐问题和构建高覆盖度的藏文音节文本语料库,深入分析研究藏文字组合结构,提出了基于混合模式的藏文文本音节切分方法,并研发了藏文自动音节切分系统,通过此方法共搜集了626类藏文字丁和19450类音节文本语料库。2.针对藏文字体非常紧密、文本图像分割难度大的问题,本文提出...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 国内外印刷体识别研究现状
1.2.2 藏文印刷体识别研究现状
1.2.3 藏文印刷体识别存在的难点
1.3 研究内容和目标
第2章 藏文印刷体文本图像预处理
2.1 图像二值化
2.2 形态学处理
2.2.1 腐蚀
2.2.2 膨胀
2.3 图像矫正
2.4 规范化
2.5 本章小结
第3章 藏文印刷体文本图像分割
3.1 藏文印刷体按行分割
3.2 藏文印刷体按列分割
3.2.1 藏文音节切分与统计
3.2.2 藏文印刷体按字丁分割
3.2.3 藏文印刷体按音节分割
3.3 分割实验
3.3.1 投影分割实验结果
3.3.2 连通域分割实验结果
3.4 本章小结
第4章 基于卷积神经网络的藏文乌金印刷体识别技术
4.1 卷积神经网络模型简介
4.2 数据集
4.3 实验结果及分析
4.3.1 藏文字丁识别实验结果及分析
4.3.2 藏文音节识别实验结果及分析
4.3.3 卷积神经网络模型的调参技术
4.4 本章小结
第5章 系统实现及分析
5.1 系统模块设计
5.1.1 预处理模块
5.1.2 分割模块
5.1.3 识别模块
5.2 藏文乌金印刷体识别系统实现
5.3 实验及结果分析
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
个人简历
本文编号:3766627
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 国内外印刷体识别研究现状
1.2.2 藏文印刷体识别研究现状
1.2.3 藏文印刷体识别存在的难点
1.3 研究内容和目标
第2章 藏文印刷体文本图像预处理
2.1 图像二值化
2.2 形态学处理
2.2.1 腐蚀
2.2.2 膨胀
2.3 图像矫正
2.4 规范化
2.5 本章小结
第3章 藏文印刷体文本图像分割
3.1 藏文印刷体按行分割
3.2 藏文印刷体按列分割
3.2.1 藏文音节切分与统计
3.2.2 藏文印刷体按字丁分割
3.2.3 藏文印刷体按音节分割
3.3 分割实验
3.3.1 投影分割实验结果
3.3.2 连通域分割实验结果
3.4 本章小结
第4章 基于卷积神经网络的藏文乌金印刷体识别技术
4.1 卷积神经网络模型简介
4.2 数据集
4.3 实验结果及分析
4.3.1 藏文字丁识别实验结果及分析
4.3.2 藏文音节识别实验结果及分析
4.3.3 卷积神经网络模型的调参技术
4.4 本章小结
第5章 系统实现及分析
5.1 系统模块设计
5.1.1 预处理模块
5.1.2 分割模块
5.1.3 识别模块
5.2 藏文乌金印刷体识别系统实现
5.3 实验及结果分析
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
个人简历
本文编号:3766627
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3766627.html
最近更新
教材专著