印刷体数学公式识别关键问题研究
本文关键词: 公式识别 粘连符号 公式切分 卷积神经网络 深度学习 出处:《沈阳工业大学》2017年硕士论文 论文类型:学位论文
【摘要】:印刷体数学公式识别是指将以图像方式输入的数学公式转化为可编辑的符号,从而实现公式的重用。目前,主流的OCR系统对普通文本的识别已达到较高水平,但在数学公式的识别方面还不理想,其中由于数学公式复杂的二维结构所导致的多种符号粘连以及数学符号种类、字体、大小的多样性是影响识别率的主要因素,需要更为有效的粘连符号切分和识别方法,从而提高数学公式整体的识别质量。论文首先对印刷体数学公式识别系统的构成及关键技术、识别中的难点进行介绍和讨论。其次,对数学公式粘连符号的切分方法进行了深入研究。针对普遍存在也更为复杂的斜体粘连问题,提出了基于优选路径评估的切分算法。该方法首先找到可能的粘连位置,利用特征因子对可能的粘连处切分线进行两步综合评估,选出性能良好的切分线,再针对不同粘连方向构建相应的组合折线切分路径,完成最终的图像切分。该方法提高了切分路径预测的准确性,有效地避免了切分对正常笔画的破坏。此外,应用深度学习理论中的卷积神经网络模型进行公式符号的识别,构建了识别公式字符的卷积神经网络,并通过实验优化网络参数。该卷积神经网络具有2个交替的卷积层与采样层,卷积层与采样窗口大小分别为5×5和2×2大小,选择线性矫正单元作为激活函数,并在网络的连接中使用了Dropout连接方式。通过大量的学习训练实现数学符号模式特征的自动提取并分类,从而解决现存方法中人工提取特征的不足,提高数学公式符号识别的准确性。为了验证方法的有效性,本文在Visual Studio 2010环境下,使用C++语言并结合OpenCV技术编程实现了基于优选评估的切分算法,用Keras框架搭建了面向公式识别的卷积神经网络。通过实验对比,本文所提出的切分方法准确率可达到90.14%,水平粘连符号切分准确率可达到85.60%。在识别测试中,神经网络对普通的公式字符集进行识别,识别率为97.46%,对经过切分处理前后的公式字符集进行识别,识别率分别为88.24%和97.29%。
[Abstract]:Print mathematical formula recognition is to convert the mathematical formula input by image into an editable symbol, so as to realize the reuse of the formula. At present, the mainstream OCR system has achieved a higher level of recognition of ordinary text. However, the recognition of mathematical formulas is not ideal, among which the diversity of mathematical symbols, typeface and size are the main factors that affect the recognition rate, which are caused by the complex two-dimensional structure of mathematical formulas, such as the adhesion of various symbols, the variety of mathematical symbols, the type of fonts and the size of mathematical symbols. In order to improve the recognition quality of mathematical formula, the paper first introduces and discusses the structure and key technology of printed mathematical formula recognition system, and the difficulties in recognition. In this paper, the segmentation method of mathematical formula adhesion symbol is deeply studied. Aiming at the problem of italic adhesion, a segmentation algorithm based on optimal path evaluation is proposed. The possible adhesion location is first found by this method. Using the characteristic factors to evaluate the possible splicing lines of adhesion in two steps, the segmentation lines with good performance are selected, and the corresponding combined broken line segmentation paths are constructed according to the different adhesion directions. The final image segmentation is completed. The method improves the accuracy of segmentation path prediction and effectively avoids the damage of segmentation to the normal stroke. In addition, the convolution neural network model in depth learning theory is used to recognize the formula symbols. A convolution neural network for recognizing formula characters is constructed, and the network parameters are optimized by experiments. The neural network has two alternating convolution layers and sampling layers. The size of the convolution layer and the sampling window are 5 脳 5 and 2 脳 2, respectively. The linear correction unit is chosen as the activation function, and the Dropout connection mode is used in the connection of the network. Through a lot of learning and training, the feature of mathematical symbol pattern can be automatically extracted and classified. In order to solve the problem of artificial feature extraction and improve the accuracy of mathematical formula symbol recognition, in order to verify the validity of the method, this paper is based on the Visual Studio 2010 environment. The segmentation algorithm based on optimal selection and evaluation is realized by using C language and OpenCV technology, and the convolution neural network oriented to formula recognition is built with Keras framework. The accuracy of the segmentation method proposed in this paper can reach 90.14, and the accuracy of horizontal adhesion symbol segmentation can reach 85.60. In the recognition test, the neural network can recognize the common formula character set. The recognition rate is 97.46 and the recognition rate of the formula character set before and after segmentation is 88.24% and 97.29 respectively.
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP183;TP391.4
【相似文献】
相关期刊论文 前10条
1 王卫华;;随意输入复杂数学公式[J];电脑迷;2009年17期
2 罗德智;全屏幕数学公式编排软件初探[J];小型微型计算机系统;1989年06期
3 文合平;数学公式的计算机表达[J];现代教育技术;2003年02期
4 肖建于;洪留荣;胡智文;;基于模糊理论的数学公式上下标关系判别[J];计算机工程与设计;2008年04期
5 郝保水;;Equation Chapter 1 Section 1联机手写数学公式识别技术[J];大众科技;2011年06期
6 郝保水;;联机手写数学公式识别技术[J];大众科技;2011年09期
7 马鸿键;李文钊;陈俏;;网络化教学中数学公式输入的简便实现[J];电脑知识与技术;2013年16期
8 王可胜;;透镜数学公式设计法问世[J];仪器制造;1984年01期
9 张晓东;;数学公式编排软件的结构与实现[J];计算机应用与软件;1988年03期
10 罗亮生;;数学公式编排中的美学原则[J];编辑之友;1989年04期
相关会议论文 前3条
1 靳简明;江红英;;印刷体数学公式处理研究现状[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 肖敏;黄磊;刘迎建;;数学公式识别系统[A];第八届全国汉字识别学术会议论文集[C];2002年
3 王庆林;周东华;刘文;;Croos下垂问题的数学模型及验证[A];1996中国控制与决策学术年会论文集[C];1996年
相关重要报纸文章 前10条
1 许中银;编辑数学试卷的 小技巧[N];中国电脑教育报;2004年
2 张清;数学公式输入不求人[N];中国电脑教育报;2002年
3 杨振中;汉王发布手写公式[N];电子资讯时报;2006年
4 张亚君;如何实现公式颜色的更改[N];中国电脑教育报;2007年
5 山东 吕立霞;一步一步学数学公式的输入[N];电脑报;2005年
6 李刚;在WPSOffice2003中编辑数学试卷的小技巧[N];江苏经济报;2004年
7 江山;汉王发布手写公式[N];中华工商时报;2006年
8 特派记者 彭瑞球;用数学公式开解时装[N];21世纪经济报道;2013年
9 杨建邺;数学公式还会吓跑人吗?[N];中国图书商报;2006年
10 特约记者 王握文 本报通讯员 徐莎 本报记者 唐先武;数学的威力有多大?[N];科技日报;2012年
相关博士学位论文 前2条
1 李峰;英文科技文档中数学公式的定位、识别与重建[D];大连理工大学;2007年
2 苏伟;基于Web的数学公式输入及可访问性关键问题研究[D];兰州大学;2010年
相关硕士学位论文 前10条
1 徐伟欣;面向检索的Word文档数学公式提取方法[D];河北大学;2015年
2 徐月霞;面向语义的数学公式N-grams索引结构研究[D];兰州大学;2015年
3 程铭;数学公式的线性输入方法研究[D];兰州大学;2015年
4 白华;数学公式读法歧义性研究[D];兰州大学;2016年
5 郭俊楠;MathML格式数学公式查重检测算法研究[D];渤海大学;2016年
6 洪赛;数学公式搜索的功能分类研究[D];兰州大学;2016年
7 王宇;文本中数学公式定位与识别算法研究与实现[D];北京交通大学;2016年
8 张虹扬;在线手写体数学公式的分割与识别算法研究[D];电子科技大学;2016年
9 彭玉南;多特征融合的数学公式字符识别技术研究[D];华中师范大学;2016年
10 陈凯燕;中文文档图像的数学公式定位[D];华中师范大学;2016年
,本文编号:1530283
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1530283.html