当前位置:主页 > 科技论文 > 自动化论文 >

票据字符识别平台研究与实现

发布时间:2023-04-04 03:47
  字符识别在现实场景中有着广泛的应用需求和研究意义。身份证的字符识别,银行票据的字符信息提取及录入,无不要求字符识别系统能够快速准确地将图像中的字符信息提取出来。本文以市场交易中常见的票据作为研究对象,探索票据图文识别的研究方法。通过成像设备获取的票据图像往往因为拍摄条件较差容易受到噪声干扰,获取到的图像也容易发生倾斜。首先,本文通过分析噪声的成因,采用去噪算法对图像进行还原操作。其次,为了将图像中冗余的信息去除,选择将图像进行二值化操作,二值化之后的图像从3通道彩色图变成灰度图,降低原始图像通道颜色的信息冗余。现有的目标检测算法在文本平直的情况下才能获得较好的检测结果。为了提高图像信息提取精度,本文对图像进行了倾斜校正。最后本文对票据图像进行版面分析,对票据不同的区域进行了分割研究,以便于对票据的关键信息进行提取。本文在文本检测算法中采用基于YOLO-v3的目标检测算法,在原始的YOLO-v3算法中融入空间注意力模块与通道注意力模块,加入空间注意力机制能使图像主体获得更高的权重,背景等内容将会获得较小的权重。通过加入通道注意力机制赋予各通道不同的权重,使信息量大的通道获得更大权重,更有...

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题来源与研究意义
    1.2 字符识别国内外发展现状
    1.3 本文主要研究内容
第2章 图像预处理以及版面分析
    2.1 票据图像预处理
        2.1.1 票据图像的噪声去除
        2.1.2 票据图像二值化
        2.1.3 票据图像的倾斜校正
    2.2 版面分析
    2.3 本章小结
第3章 文本检测算法
    3.1 深度卷积神经网络
    3.2 深度学习目标检测网络
    3.3 注意力机制
        3.3.1 空间注意力机制
        3.3.2 通道注意力机制
    3.4 文本检测算法
        3.4.1 多尺度图像金字塔
            3.4.1.1 高斯金字塔
            3.4.1.2 拉普拉斯金字塔
        3.4.2 基于改进型YOLO-v3 的目标检测网络
            3.4.2.1 初始化候选框
            3.4.2.2 稀疏训练
            3.4.2.3 通道剪枝
    3.5 文本检测实验与分析
        3.5.1 文本检测数据集
        3.5.2 试验参数设置与实验结果分析
    3.6 本章小结
第4章 文本识别算法
    4.1 基于深度学习的文本识别算法
        4.1.1 特征提取网络
        4.1.2 特征序列识别
        4.1.3 长短期记忆网络
        4.1.4 改进型长短期记忆网络
        4.1.5 序列识别解码
        4.1.6 文本识别算法框架
    4.2 语言模型
        4.2.1 门控卷积神经网络
    4.3 文本识别实验与分析
        4.3.1 文本识别数据集
        4.3.2 参数设置
        4.3.3 实验结果分析
    4.4 本章小结
第5章 票据图像字符识别平台实现
    5.1 票据图像字符识别算法流程
    5.2 模块介绍
        5.2.1 数据构建模块
        5.2.2 文本定位识别模块
        5.2.3 票据字符识别界面展示
    5.3 本章小结
第6章 研究结论与展望
    6.1 工作结论及创新点
    6.2 展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果



本文编号:3781724

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3781724.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a6c22***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com