基于Tesseract-OCR的古代汉语文字识别方法的设计与实现
发布时间:2023-05-06 20:02
目前市场上针对现代汉语的文字识别技术已趋于成熟,然而,由于古代文献存在背景噪声的干扰、不同书写风格等客观原因,让古代汉语文字的识别变得较为复杂,所以本文针对中国古代汉语文字识别方法进行研究和设计实现。首先,通过对国内外相关技术的研究现状进行分析,本文对文字图像预处理方法和深度神经网络进行了研究,建立模型识别和算法验证测试。图像预处理方面,在图像预处理部分:先利用MATLAB工具,根据迭代法原理设计程序,完成图像二值化的仿真实验;其次利用线性灰度拉伸图像增强算法和二次函数图像增强算法和倾斜校正算法,通过四对透视变换前后对应点的坐标算出畸变参数从而求得变换前后关系,达到还原图形,实现透视变换。深度神经网络技术方面:首先对Tesseract-OCR开源引擎基本原理进行介绍;其次对LSTM神经网络识别算法进行研究,包括基于CNN的图像特征提取和基于LSTM的语义信息提取;最后,对模型结构及测试结果进行总结。最后,本文基于Tesseract-OCR进行了古代汉语文字识别原型的设计,包括系统架构、系统功能的设计和系统原型实现与功能测试,测试结果表明基于Tesseract-OCR的古代汉语文字识别方...
【文章页数】:56 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 课题背景及研究意义
1.2 图像预处理技术的国内外研究
1.2.1 国内研究
1.2.2 国外研究
1.3 Tesseract技术及深度神经网络的国内外研究
1.3.1 国内研究
1.3.2 国外研究
1.4 研究内容
第二章 汉字识别相关技术介绍
2.1 图像预处理技术
2.2 Tesseract技术
2.3 深度神经网络技术
2.3.1 基于CNN的图像特征提取
2.3.2 基于LSTM的语义信息提取
2.4 本章小结
第三章 古代汉语文字图像预处理和识别方法的设计
3.1 二值化
3.2 图像增强
3.2.1 线性灰度值拉伸图像增强
3.2.2 二次函数图像增强
3.3 倾斜校正
3.4 Tesseract-OCR基本原理
3.4.1 引擎架构介绍
3.4.2 文本字符识别
3.5 模型结构及测试结果
3.6 本章小结
第四章 基于Tesseract-OCR的古代汉语文字识别系统实现
4.1 系统架构设计
4.2 系统功能设计
4.2.1 图像上传模块功能设计
4.2.2 图像预处理模块功能设计
4.2.3 文字识别模块功能设计
4.3 系统原型实现与功能测试
4.3.1 系统原型实现
4.3.2 系统功能测试
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录1 攻读硕士学位期间申请的专利
致谢
本文编号:3809534
【文章页数】:56 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 课题背景及研究意义
1.2 图像预处理技术的国内外研究
1.2.1 国内研究
1.2.2 国外研究
1.3 Tesseract技术及深度神经网络的国内外研究
1.3.1 国内研究
1.3.2 国外研究
1.4 研究内容
第二章 汉字识别相关技术介绍
2.1 图像预处理技术
2.2 Tesseract技术
2.3 深度神经网络技术
2.3.1 基于CNN的图像特征提取
2.3.2 基于LSTM的语义信息提取
2.4 本章小结
第三章 古代汉语文字图像预处理和识别方法的设计
3.1 二值化
3.2 图像增强
3.2.1 线性灰度值拉伸图像增强
3.2.2 二次函数图像增强
3.3 倾斜校正
3.4 Tesseract-OCR基本原理
3.4.1 引擎架构介绍
3.4.2 文本字符识别
3.5 模型结构及测试结果
3.6 本章小结
第四章 基于Tesseract-OCR的古代汉语文字识别系统实现
4.1 系统架构设计
4.2 系统功能设计
4.2.1 图像上传模块功能设计
4.2.2 图像预处理模块功能设计
4.2.3 文字识别模块功能设计
4.3 系统原型实现与功能测试
4.3.1 系统原型实现
4.3.2 系统功能测试
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
附录1 攻读硕士学位期间申请的专利
致谢
本文编号:3809534
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3809534.html
最近更新
教材专著