基于深度学习的文本检测与识别技术研究

发布时间:2021-05-21 01:09
  近些年随着社交网络的发展,处理日益增长的各种视觉信息已经成为了一个无法避免的需求。在这些视觉信息中有很多是复杂场景下的图片,如招牌图片、商铺图片、交通标志等自然场景下的图片,也有试卷、报纸等印刷体的图片。复杂场景下的图片由于背景复杂、字体多样、语种未知、版面格式不统一、光照等因素影响,文本检测与识别的难度大大增加。但理解复杂场景中的文本信息对于人机交互、自动驾驶、增强现实等都有很多现实意义。本课题是对不同的文本检测与识别技术进行研究,分别是传统OCR的多阶段的文本检测与识别技术和端到端的文本检测与识别技术,然后针对两种各有优缺点的技术分别应用于两个不同的复杂场景,两个应用场景具体为多学科试卷图文混排的场景和自然场景中语种未知的场景。将传统OCR的多阶段的文本检测与识别技术应用于多学科试卷图文混排的复杂场景下,关键在于多粒度的版面分析。该系统是按照传统的OCR方法步骤来进行的,按照文本检测、文本分割、字符识别三个步骤依次进行。首先采用均值滤波和Hough变换来对图像进行预处理,然后使用Faster RCNN算法来进行粗粒度分类。接着使用Mask RCNN算法来进行小题的细粒度分类。最后只... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:94 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究的目的和意义
        1.1.1 课题背景
        1.1.2 研究的目的和意义
    1.2 国内外研究现状
        1.2.1 深度学习的研究现状
        1.2.2 文本检测的研究现状
        1.2.3 文本识别的研究现状
        1.2.4 端到端的文本检测与识别的研究现状
        1.2.5 多语种文本的文本检测与识别的研究现状
        1.2.6 文本检测与识别的评价指标
        1.2.7 文本检测与识别的常用数据集
    1.3 本文主要研究内容及章节安排
第2章 复杂场景文本检测与识别系统的需求分析和总体设计
    2.1 引言
    2.2 多学科试卷内容检测与识别子系统的需求分析
        2.2.1 系统的功能需求
        2.2.2 系统的非功能需求
    2.3 多学科试卷内容检测与识别系统的总体设计
        2.3.1 系统的总体功能设计
        2.3.2 粗粒度分类模块和细粒度分类模块的模块划分
    2.4 端到端的自然场景文本检测与识别子系统的需求分析
        2.4.1 系统的功能需求
        2.4.2 系统的非功能需求
    2.5 端到端的自然场景文本检测与识别系统的总体设计
        2.5.1 系统的总体功能设计
        2.5.2 系统的总体架构设计
    2.6 本章小结
第3章 复杂场景文本检测与识别系统的详细设计与实现
    3.1 引言
    3.2 多学科试卷内容检测与识别系统的详细设计与实现
        3.2.1 数据标注模块的详细设计与实现
        3.2.2 数据预处理模块的详细设计与实现
        3.2.3 粗粒度分类模块的详细设计与实现
        3.2.4 细粒度分类模块的详细设计与实现
        3.2.5 字符识别模块的详细设计与实现
    3.3 端到端的自然场景文本检测与识别系统的详细设计与实现
        3.3.1 端到端的自然场景文本检测与识别系统的总体算法设计
        3.3.2 FPN算法的详细设计与实现
        3.3.3 LNMS(Locality-aware NMS)的详细设计与实现
        3.3.4 spatial transformer layer的详细设计与实现
        3.3.5 损失函数的详细设计与实现
    3.4 本章小结
第4章 复杂场景文本检测与识别系统的测试和性能分析
    4.1 引言
    4.2 多学科试卷内容检测与识别系统的测试与性能分析
        4.2.1 系统的实验数据及参数设置
        4.2.2 系统的测试策略
        4.2.3 系统的测试结论
    4.3 端到端的自然场景文本检测与识别系统的测试与性能分析
        4.3.1 系统的实验数据及参数设置
        4.3.2 系统的测试策略
        4.3.3 系统的测试结论
    4.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
个人简历



本文编号:3198768

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3198768.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9a200***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com