基于深度学习的光学字符识别技术研究

发布时间:2021-04-23 16:36
  光学字符识别(OCR)技术目前主要是在文档及证件识别等方面应用。其中文档识别可以把手写文档或印刷文档的文字信息数字化,快速并准确提取有效信息。现阶段飞速发展的深度学习应用到OCR,不仅适用不同的场景,而且字符识别的准确率可以得到提高。本文的主要工作是利用深度学习建立手写字符识别框架,并在智能手机实现。OCR的步骤主要是文字区域检测,字符切割和识别。字符的识别作为本文的研究重点,因此结合深度学习对此进行优化。首先总结了可用于字符识别的深度学习网络。详细分析了深度卷积神经网络与循环神经网络架构,并介绍了深度学习框架Tensorflow。其次,由于数据集的规模对于训练模型至关重要,因此扩充了数据集。基于文本行图像书写尺度的可变性,利用多尺度文本来扩充数据集。然后,改善对系统性能好坏影响极大的特征提取。利用残差思想对卷积神经网络进行适当的改进与优化,改变特征提取过程中信息的传播方法,提高特征提取的准确率。最后,针对传统OCR应用时设备便携性差问题,进行改进。过去在使用OCR技术识别文字时,文档图像主要是通过扫描仪或照相机等设备来获取,可适用场合受限。因此本文提出基于智能手机的手写字符识别技术的... 

【文章来源】:南京邮电大学江苏省

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
专用术语注释表
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 字符识别研究现状
        1.2.2 深度学习研究现状
    1.3 主要研究内容
    1.4 论文的组织结构
第二章 相关背景知识
    2.1 卷积神经网络
        2.1.1 神经网络简介
        2.1.2 卷积网络简介
    2.2 循环神经网络
        2.2.1 循环神经网络结构
        2.2.2 循环神经网络模式
    2.3 深度学习框架Tensorflow
    2.4 本章小结
第三章 基于CRNN的手写字符图像特征提取
    3.1 网络框架介绍
    3.2 特征提取
        3.2.1 卷积层
        3.2.2 池化层
        3.2.3 损失函数和优化算法
    3.3 训练集扩容
        3.3.1 数据集扩容训练
        3.3.2 实验结果及分析
    3.4 本章小结
第四章 基于深度卷积-残差的手写文本图像识别
    4.1 改进的特征提取网络
    4.2 序列标记技术
    4.3 实验设计与分析
        4.3.1 真实数据集
        4.3.2 实验设置
    4.4 本章小结
第五章 手写文本识别APP的设计与实现
    5.1 需求分析
    5.2 功能分析
    5.3 系统的设计与实现
        5.3.1 功能结构图
        5.3.2 主要功能流程图
    5.4 字符识别app的实现
        5.4.1 文档图像获取
        5.4.2 文档图像识别
    5.5 本章小结
第六章 总结与展望
    6.1 论文总结
    6.2 研究展望
参考文献
附录 攻读硕士学位期间撰写的论文
致谢


【参考文献】:
期刊论文
[1]智能视频监控技术综述[J]. 黄凯奇,陈晓棠,康运锋,谭铁牛.  计算机学报. 2015(06)
[2]一种完整的汉字识别系统设计[J]. 印月,黄山.  微计算机信息. 2009(13)
[3]基于神经网络的字符识别研究[J]. 杨庆雄.  信息技术. 2005(04)
[4]基于人工神经网络的数字字符识别[J]. 武强,童学锋,季隽.  计算机工程. 2003(14)

硕士论文
[1]深度学习及其在脱机手写汉字识别领域的应用研究[D]. 刘全升.华南理工大学 2016



本文编号:3155667

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3155667.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户248d0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com