基于循环神经网络的光学字符识别研究

发布时间:2023-04-03 02:05
  随着近代计算机技术的飞速发展,诸如车牌识别、电子文档识别、商务票据管理、拍照翻译等应用场景随处可见,如果利用光学字符识别(Optical Character Recognition,简称OCR)技术对图像进行自动文字识别减少人们工作,将大幅提高人们的工作效率和生活品质。因此,OCR技术成为了计算机视觉技术中的重要发展方向之一。在自然场景中,获取的文字图像会因为拍摄时的对焦不准、光线不足、噪点太多、角度倾斜、成像畸变等问题,以及文字存在具有不同的大小、字体、颜色、排列方式等差异化问题,导致文字识别准确率较差。因此,针对自然图像中文字区域倾斜导致图片质量较差的问题,本文提出了一体化的光学检测和识别系统,提出基于深度学习神经网络的文字图像检测方法,并且利用循环神经网络重点解决了文字图像识别的难题。具体内容如下:首先针对文字检测模块提出了基于YOLO-text网络的文字检测与校正方法,选取了目标检测网络YOLOv3作为基础,优化改进了YOLOv3不适合做文字检测的缺点。并在YOLO-text的基础上,为解决在自然场景图像中存在非水平文字区域的问题,提出使用“微积分思想”的先检测字母边界框,再将...

【文章页数】:79 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
缩略语对照表
第一章 绪论
    1.1 论文研究背景及意义
    1.2 国内外研究现状
        1.2.1 文字检测研究的发展
        1.2.2 文字识别研究的发展
    1.3 本文主要贡献及组织结构
第二章OCR相关技术基础
    2.1 OCR系统流程
    2.2 图像预处理方法
        2.2.1 图像二值化
        2.2.2 字符分割
    2.3 神经网络理论
        2.3.1 神经网络简介
        2.3.2 卷积神经网络
        2.3.3 循环神经网络
        2.3.4 损失函数
        2.3.5 反向传播算法
        2.3.6 神经网络常用方法
    2.4 本章小结
第三章 基于YOLO-text的文字检测及校正模块设计
    3.1 引言
        3.1.1 文字检测流程
        3.1.2 关于目标检测网络选择的讨论
    3.2 YOLO-text网络结构设计
    3.3 文字校正
        3.3.1 基于微积分思想的文字校正
        3.3.2 基于角度回归思想的文字校正
    3.4 本章小结
第四章 基于STN-text的文字识别模块设计
    4.1 引言
        4.1.1 文字识别流程
        4.1.2 CRNN简介
    4.2 文字图像预处理
    4.3 STN-text网络结构设计
    4.4 本章小结
第五章 自然场景文字检测与识别系统设计与实验分析
    5.1 自然场景文字检测与识别系统介绍
    5.2 文字检测模块实验分析
        5.2.1 数据集简介
        5.2.2 对比方法介绍
        5.2.3 对比实验结果与分析
    5.3 文字识别模块实验分析
        5.3.1 数据集介绍
        5.3.2 对比方法介绍
        5.3.3 STN-text代码的构建
        5.3.4 对比实验结果与分析
    5.4 系统实验与结果分析
    5.5 本章小结
第六章 总结与展望
    6.1 研究工作总结
    6.2 研究计划展望
参考文献
致谢
作者简介
    1. 基本状况
    2. 教育背景



本文编号:3780431

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3780431.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2637d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com