基于多任务级联的场景文本检测算法研究

发布时间:2023-03-24 21:32
  文字是重要的信息传递载体,能表达高级语义信息,场景文本作为重要的表现形式在生活中大量出现。近年来,在学术界和工业界,场景文本检测已成为理论研究和应用的热点。场景文本检测是OCR的重要环节,被广泛地应用于车牌检测识别、卡证票据检测识别、场景文本情感分析等。由于深度学习的发展,基于深度学习的方法在解决场景文本检测问题中占据主要地位。但场景文本复杂,现有方法仍存在不足,例如尺度变化、种类多样(不同语种和文本类型)、方向任意(多方向、弯曲等)、文本视觉特征杂乱(结构共性少)等。针对以上问题,本文通过分析基于检测和基于分割的场景文本检测方法,建立两种多任务级联的场景文本检测方案。上下文模块与辅助回归的方法主要用于解决多方向文本检测问题。在场景文本特征提取和特征融合方面,主要利用上采样特征融合方法,多分支上下文模块等提取有鉴别力的图像文本特征;在二次检测框架中,该模块有利于提取更好的候选区域;在多任务级联方法上,主要结合坐标对齐的场景文本检测和实例分割的方法,增加基于中心点和角点的辅助回归方法,改进了一般的实例分割分支,提高了多方向文本检测的准确率。特征金字塔融合的场景文本检测方法不仅能用于解决多...

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及研究的目的和意义
    1.2 国内外研究现状
        1.2.1 基于手工特征的文本检测
        1.2.2 深度学习检测方法
        1.2.3 深度学习分割方法
    1.3 本文的主要研究内容
    1.4 本文的组织结构
第2章 上下文模块与辅助回归的多方向文本检测
    2.1 引言
    2.2 特征提取网络
    2.3 上采样特征融合
    2.4 多分支上下文模块
        2.4.1 卷积核与特征提取
        2.4.2 上下文模块设计
    2.5 基于二次检测器的文本检测网络
        2.5.1 RPN候选区域提取方法
        2.5.2 文本目标分类
        2.5.3 文本目标回归
    2.6 基于中心点与角点辅助回归的掩膜分割分支
        2.6.1 实例分割方法
        2.6.2 辅助回归方法
    2.7 本章小结
第3章 特征金字塔融合的多方向及弯曲文本检测
    3.1 引言
    3.2 基于特征金字塔的特征提取融合
        3.2.1 特征金字塔网络
        3.2.2 候选文本目标非极大抑制
        3.2.3 候选文本目标在线难例挖掘
        3.2.4 同步批归一化
        3.2.5 文本区域后处理
    3.3 实例分割的弯曲文本检测
    3.4 本章小结
第4章 实验结果及分析
    4.1 引言
    4.2 数据集及特点
    4.3 模型选择和训练
        4.3.1 数据预处理方法
        4.3.2 多方向文本检测模型训练和测试
        4.3.3 多方向及弯曲文本检测模型训练和测试
    4.4 实验结果及分析
        4.4.1 评价指标计算方法
        4.4.2 特征融合方法对比实验
        4.4.3 多方向文本检测模型实验结果
        4.4.4 多方向及弯曲文本检测模型实验结果
    4.5 模型对比分析
    4.6 模型应用场景分析
    4.7 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢



本文编号:3769885

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3769885.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa592***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com