A Top-down Attention Based Approach for Printed Mathematical

发布时间:2022-07-19 17:14
  研究背景和意义随着互联网的发展,如今绝大多数材料以电子文档的形式存储在计算机上。印刷文件也可以通过扫描,拍照等转换成电子文档。可选字符识别(OCR)是将文档内容转换为计算机文本的关键技术。经过多年的发展,OCR技术逐渐成熟,其应用范围也越来越广泛。目前,OCR不仅可以识别文献中的常用词,还可以识别数学表达式(ME)。通过使用OCR来识别打印的数学表达式,可以实现数学表达式的重用。现有的OCR系统能够准确有效地识别文档中的字符,但仍然无法很好地处理数学表达式。对于某些没有特殊数学符号的一维数学表达式,可以识别它,但对于诸如积分符号和根符号的数学符号,它不能很好地工作。数学表达式仍保存为图像,无法识别,无法编辑和重复使用。这使得一些以数学表达为中心的文章难以编辑,并且图像占用大量存储空间以影响传输速度。因此,扩展OCR系统的应用以识别文本中的数学表达式具有重要意义。数学表达符号与普通文本不同,它们的布局主要以二维结构呈现,这导致字符在各种情况下被卡住并且分割的复杂性。使用传统的字符粘附分割方法很难获得满意的结果。大多数方法只能解决一两种特定情况,例如简单的水平或垂直关系等。那些拥有复杂符号... 

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
Acknowledgements
Abstract
Chapter 1 Introduction
    1.1 Motivation
    1.2 Research Status
    1.3 Objective
    1.4 Thesis Structure
Chapter 2 Related Work
    2.1 Artificial Neural Network
        2.1.1 Feedforward Neural Network
        2.1.2 Convolutional Neural Network
        2.1.3 Recurrent Neural Network——Gated Recurrent Unit
    2.2 Encoder-Decoder Framework
    2.3 Attention Mechanism
        2.3.1 Why Introduce Attention Mechanism
        2.3.2 Classification of Attention Mechanism
    2.4 Word Embedding
Chapter 3 Proposed Mathematical Expression Recognition System
    3.1 Encoder
        3.1.1 Feature Extraction
        3.1.2 Context Representation
    3.2 Decoder
        3.2.1 Language Model
        3.2.2 Decoder with Attention Mechanism
        3.2.3 Attention Visualization
Chapter 4 Experiments
    4.1 Model Architecture
        4.1.1 Deep Convnets Architecture
        4.1.2 Bi-RNN Architecture
    4.2 Training Procedure
        4.2.1 Data Preprocessing
        4.2.2 Word Embedding
        4.2.3 Experimental Environment
        4.2.4 Experimental Parameter Setting
        4.2.5 Testing Stage
    4.3 Evaluation Metrics
        4.3.1 Match Score
        4.3.2 BELU
    4.4 Comparison of Experimental Results
        4.4.1 Experiment Ⅰ: with Or without Attention Mechanism
        4.4.2 Experiment Ⅱ: with Or without Bi-RNN
        4.4.3 Comparison with Other Systems
        4.4.4 Experiment in Handwritten Mathematical Expression Recognition
Chapter 5 Summary and Future Work
    5.1 Summary
    5.2 Future Work
References
Appendix A


【参考文献】:
期刊论文
[1]基于改进遗传算法的下采样图像水印算法研究[J]. 魏志成,李建雄,戴居丰.  光电子.激光. 2007(07)



本文编号:3663818

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3663818.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69ed2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com