中文票据图像处理和智能识别技术研究
发布时间:2023-05-11 06:06
汉字由于本身具有字体风格多样、字符集巨大、字符相似性高等特征,因此比英文字母更加难以识别,这就给识别研究带来了很大的挑战性。而中文票据则由于版面更为复杂包含各种印章、表格、不规则图案等,因此比普通的标准中文文档更具挑战性。目前市场上虽然有各种型号的OCR设备,号称识别率可达99.99%,但是在现实情况中,除名片、身份证等类的表面图案复杂度低、面积较小、不易弯折、字体结构比较单一的类别的目标物时比较容易识别,其它类似于票据类的薄纸质类目标物,目前市场上的OCR产品对带有中文的票据类目标物识别效果都不算太理想,有待进一步改进。本课题结合一些传统图像处理算法和目前性能比较好的几个深度神经网络的算法,对传统中文票据识别系统做了一些改进和优化,本课题主要做了如下几点的工作:首先,训练样本的制作部分,训练数据集增广的方法除了采用了传统的仿射变换和加随机噪声的方法外,还引入了条件生成对抗网络,对训练样本做了比较好的扩充,将十分有利于后面识别模型的训练。其次,识别模型部分,采用了深度卷积神经网络,本课题将目前性能比较优良的几个神经网络分类算法架构,根据本课题的实际需求做了一下结构上的调整,通过实验我们...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外发展现状
1.3 本文主要研究的内容
第二章 票据识别系统相关理论知识
2.1 票据的去噪相关理论知识
2.1.1 RGB空间介绍
2.1.2 HSV空间介绍
2.2 感兴趣文字区域定位相关原理
2.3 文字的切割部分相关原理
2.3.1 垂直投影法
2.3.2 OTSU自动阈值分割算法
2.4 数据集增广相关原理
2.4.1 仿射变换
2.4.2 生成对抗网络
2.5 识别算法相关原理
2.5.1 现有的识别算法
2.5.2 深度神经网络相关原理
2.6 纠错算法相关原理
2.6.1 常规的统计学语言模型
2.6.2 LSTM网络的介绍
第三章 文字切割与训练字符集的获取
3.1 原始票据图片的预处理
3.1.1 原始票据在RGB域的分析
3.1.2 原始票据在HSV域的分析
3.2 感兴趣文字区域的定位
3.2.1 霍夫变换直线检测法
3.3 文字的切割
3.3.1 垂直投影法
3.3.2 改进型的连通域分割法
3.4 训练样本的制作
3.4.1 初始训练集的制作
3.4.2 初略识别的模型创建
3.4.3 真实场景下的数据集的获取
3.4.4 训练集进一步增广
第四章 识别和纠错算法
4.1 识别算法
4.1.1 现有的识别算法
4.1.2 深度神经网络的方法
4.2 纠错算法
4.2.1 常规的统计学语言模型
4.2.2 长短记忆网络模型
4.3 算法模型的部署
第五章 系统设计与实验结果分析
5.1 票据识别系统的流程
5.2 原始图片的初步去噪实验
5.3 文字区域的定位实验
5.4 文字切割算法的验证
5.5 识别模型和纠错模型的测试
5.5.1 识别模型的单独测试
5.5.2 识别模型和纠错模型的联合测试
5.6 系统测试
总结与展望
参考文献
攻硕期间取得的成果
致谢
本文编号:3814317
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外发展现状
1.3 本文主要研究的内容
第二章 票据识别系统相关理论知识
2.1 票据的去噪相关理论知识
2.1.1 RGB空间介绍
2.1.2 HSV空间介绍
2.2 感兴趣文字区域定位相关原理
2.3 文字的切割部分相关原理
2.3.1 垂直投影法
2.3.2 OTSU自动阈值分割算法
2.4 数据集增广相关原理
2.4.1 仿射变换
2.4.2 生成对抗网络
2.5 识别算法相关原理
2.5.1 现有的识别算法
2.5.2 深度神经网络相关原理
2.6 纠错算法相关原理
2.6.1 常规的统计学语言模型
2.6.2 LSTM网络的介绍
第三章 文字切割与训练字符集的获取
3.1 原始票据图片的预处理
3.1.1 原始票据在RGB域的分析
3.1.2 原始票据在HSV域的分析
3.2 感兴趣文字区域的定位
3.2.1 霍夫变换直线检测法
3.3 文字的切割
3.3.1 垂直投影法
3.3.2 改进型的连通域分割法
3.4 训练样本的制作
3.4.1 初始训练集的制作
3.4.2 初略识别的模型创建
3.4.3 真实场景下的数据集的获取
3.4.4 训练集进一步增广
第四章 识别和纠错算法
4.1 识别算法
4.1.1 现有的识别算法
4.1.2 深度神经网络的方法
4.2 纠错算法
4.2.1 常规的统计学语言模型
4.2.2 长短记忆网络模型
4.3 算法模型的部署
第五章 系统设计与实验结果分析
5.1 票据识别系统的流程
5.2 原始图片的初步去噪实验
5.3 文字区域的定位实验
5.4 文字切割算法的验证
5.5 识别模型和纠错模型的测试
5.5.1 识别模型的单独测试
5.5.2 识别模型和纠错模型的联合测试
5.6 系统测试
总结与展望
参考文献
攻硕期间取得的成果
致谢
本文编号:3814317
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3814317.html
最近更新
教材专著