基于深度学习的印刷体数学公式符号识别方法研究
发布时间:2017-05-02 14:00
本文关键词:基于深度学习的印刷体数学公式符号识别方法研究,由笔耕文化传播整理发布。
【摘要】:印刷体数学公式识别是光学字符识别领域中的一个重要研究课题,目的是将以图像方式输入的印刷体数学公式转化为可编辑的符号,实现公式的重用。由于数学公式结构复杂,数学符号种类繁多且字体多样、大小不一,目前其识别效果并不理想,需要更为有效的识别方法。本文将深度学习中的卷积神经网络理论应用到数学符号识别中,旨在克服传统符号识别方法中手工提取特征的不足,通过构建具有多个隐含层的深度网络模型并使用大量的训练数据来学习得到更有用的特征,进而提升公式符号分类的准确性。本文对数学公式识别的关键技术、研究现状以及卷积神经网络的理论进行了研究,在此基础上建立了面向公式符号识别的卷积神经网络结构,并通过大量的对比实验确定网络的最优参数。该网络由一个输入层、输出层、两个卷积层和采样层交替组成,输入层直接对应经公式定位及分割处理后的公式符号图像,采用5×5大小的卷积核对符号图像进行特征抽取。执行卷积时,将传统的Sigmoid和双曲正切激活函数替换为更接近生物神经的ReLU激活函数,以提高模型训练的收敛速度,并解决梯度消失问题。对提取到的卷积特征图采用2×2的最大池化方式进行采样,从而在降低特征维数、保留特征的同时,减少参数计算量,这种卷积与采样相结合的方式使特征具有一定的旋转不变性。输出层采用Dropout连接方式减轻了网络的过拟合程度并提高泛化能力。此外,针对卷积神经网络训练速度慢的问题,本文采用基于CUDA的GPU编程方法,实现了对训练速度的大幅度提升。为验证所提出算法的有效性,本文应用VS2010设计并实现了一个印刷体数学公式识别系统。以包含公式的文档图像作为系统的输入,经过版面校正处理、公式图像预处理、公式符号识别和公式结构分析,最后将结果输出。通过大量的实验和对比,本文所提出方法的公式符号的平均识别率可以达到99%,高于现有识别方法,可以满足实际应用的需要。
【关键词】:卷积神经网络 数学公式符号识别 深度学习 CUDA GPU
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP183;TP391.41
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-17
- 1.1 研究背景及意义9
- 1.2 印刷体数学公式符号识别研究现状9-16
- 1.2.1 数学公式识别概述9-12
- 1.2.2 数学公式识别关键技术12-15
- 1.2.3 数学公式识别软件系统15-16
- 1.3 研究目标与主要工作16
- 1.4 本文结构安排16-17
- 第2章 深度学习和卷积神经网络17-25
- 2.1 深度学习17
- 2.2 稀疏编码17-18
- 2.3 深信度网络18-20
- 2.4 卷积神经网络20-25
- 2.4.1 卷积神经网络的提出20
- 2.4.2 卷积神经网络的网络结构20-22
- 2.4.3 训练过程22-23
- 2.4.4 卷积神经网络的应用23-25
- 第3章 公式符号识别的CNN模型的构建25-35
- 3.1 公式符号识别的CNN结构25-27
- 3.1.1 输入层25
- 3.1.2 卷积层25-26
- 3.1.3 采样层26
- 3.1.4 输出层26-27
- 3.2 网络参数优化27-31
- 3.2.1 网络结构参数27-28
- 3.2.2 激活函数28-30
- 3.2.3 全连接方式30
- 3.2.4 调整回归下降方式30-31
- 3.3 实验结果与讨论31-35
- 3.3.1 实验设置31
- 3.3.2 整体测试及对比测试31-32
- 3.3.3 进一步讨论32-35
- 第4章 印刷体数学公式识别系统的设计与实现35-53
- 4.1 软件设计方案35-40
- 4.1.1 功能描述35-36
- 4.1.2 开发环境36-40
- 4.2 主要功能的详细设计40-53
- 4.2.1 识别相关处理40-46
- 4.2.2 字符识别46-53
- 第5章 结论53-54
- 参考文献54-57
- 在学研究成果57-58
- 致谢58
【参考文献】
中国期刊全文数据库 前10条
1 张立;朱玉全;陈耿;;基于卷积神经网络SLeNet_5的车牌识别方法[J];信息技术;2015年11期
2 龚丁禧;曹长荣;;基于卷积神经网络的植物叶片分类[J];计算机与现代化;2014年04期
3 高学;王有旺;;基于CNN和随机弹性形变的相似手写汉字识别[J];华南理工大学学报(自然科学版);2014年01期
4 孙志军;薛磊;许阳明;王正;;深度学习研究综述[J];计算机应用研究;2012年08期
5 计春雷;冯伟;黎明;杨杰;;一种动态阈值加填补的指纹图像二值化算法[J];计算机仿真;2011年07期
6 赵志宏;杨绍普;马增强;;基于卷积神经网络LeNet-5的车牌字符识别研究[J];系统仿真学报;2010年03期
7 陈德裕;朱学芳;苏啸晨;杭月芹;;印刷体文献中数学公式识别及描述系统研究[J];计算机应用;2009年03期
8 李刚;宋文静;;基于图像直方图的车牌图像二值化方法研究[J];交通运输系统工程与信息;2009年01期
9 安艳辉;董五洲;;基于识别反馈的粘连字符切分方法研究[J];河北省科学院学报;2008年02期
10 张庆丰;岑豫皖;杜培明;;数显数字字符图像特征提取算法的研究与实现[J];计算机技术与发展;2007年11期
本文关键词:基于深度学习的印刷体数学公式符号识别方法研究,由笔耕文化传播整理发布。
,本文编号:341050
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/341050.html