当前位置:主页 > 教育论文 > 阅读论文 >

Read Math Problems Using A Multi-stage Method

发布时间:2021-07-28 08:33
  教育是人类生活中不可或缺的领域,而考试是检验教育成果的基本手段之一。因此,在各级学校,尤其是中小学中,教师的很大一部分精力耗费在批改试卷和评分上,而且纸质试卷也需要一定的空间进行存储。因此,试卷的数字化和识别有助于减轻教师工作压力,减少试卷的存储和维护成本,同时方便查找特定试卷,并可以为未来的教育领域应用,如自动评分系统提供数据准备。为了识别试卷、将试卷数字化,本文提出了一种多阶段的方法读取数学试卷中的题目。该方法主要包括文档版面分析、字符分割、中文与非中文文本分类、字符识别等四个阶段。通过扫描得到的数学试卷图片经过二值化得到黑白两色图像,再使用图像腐蚀方法对文本部分进行膨胀处理,然后使用文档版面分析方法对图片进行连通域分析,根据连通域的高度将图片中的各种图和文本分离。从图片中提取文本部分之后,使用字符分割方法将纯文本图片分割成单个字符的图片。在中文与非中文文本分类部分,使用深度学习方法,训练深层神经网络对字符分割的结果进行分类。由于网络上已有很多程序接口和网站可以执行中文识别,并且可以取得很好的效果,在本文所提出的多阶段读题方法中,不包含对中文字符的识别。在得到中文与非中文文本分类的... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
abstract
摘要
Acknowledgements
Chapter 1 Introduction
    1.1 Research Background
    1.2 Research Challenges
    1.3 Objectives and Contributions
    1.4 Thesis Structure
Chapter 2 Literature Review
    2.1 Document Layout Analysis
    2.2 Character Recognition
    2.3 Convolutional Neural Networks
    2.4 Summary
Chapter 3 The Proposed Framework
    3.1 Overview
    3.2 Document Layout Analysis for Test Papers
    3.3 Character Segmentation
    3.4 The Two-stage Method for Character Recognition using DCNNs
    3.5 Summary
Chapter 4 Experiments
    4.1 Experiment Settings
        4.1.1 Dataset
        4.1.2 Development Environment
    4.2 Experiment Results
        4.2.1 Document Layout Analysis
        4.2.2 Character Segmentation
        4.2.3 Binary Classification
        4.2.4 Character Recognition
        4.2.5 Reading Problems
    4.3 Summary
Chapter 5 Conclusion and Future Work
References
Index



本文编号:3307584

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/ydsp/3307584.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a4e6e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com