基于深度学习的发票识别研究

发布时间:2024-03-09 07:37
  在现代信息社会,由于国民经济的健康发展与科学技术的提高,人们的经济活动也变得更加频繁,发票成为了记录经济活动的重要载体。然而,在传统的发票录入流程中,大多数录入工作都需要人工完成,这种录入方式效率低下且浪费人力资源。随着光学字符识别(Optical Character Recognition,OCR)技术与深度学习技术的兴起,给人们自动化的信息提取提供了极大的便利,因此,利用深度学习技术来解决发票的快速识别具有重要的现实意义。本文基于深度学习技术对发票识别算法开展研究工作,以最常见的发票为例,根据发票图片的内容特点,将发票识别任务分为两个主要步骤:文本区域检测和文字识别,并通过两个基于深度学习的算法模型实现发票的快速识别,本文主要工作如下:(1)发票文本区域检测部分,选用Pse Net网络模型作为基本框架进行发票文本区域检测。在原有的网络结构中加入了可以扩大感受野的形变卷积,提高了模型的特征提取能力;结合工作实际,根据发票文本的实际场景进行分析,引入了dice coefficient loss损失函数,有效避免了检测结果偏向非文本区域;收集发票图片并制作发票数据集作为模型训练数据,进一...

【文章页数】:64 页

【部分图文】:

图1.1发票图像

图1.1发票图像

南京邮电大学专业学位硕士研究生学位论文第一章绪论1第一章绪论课题的研究背景及意义在日常生活中,我们会在多个场合使用到增值税发票,对于一般纳税人都可合理合法使用它进行经济活动。对比普通税收类别的发票,增值税发票对税金扣税的项目标明也更加的清晰,所以可以成为记录销货方纳税和购货方进税....


图2.2基于MSER的发票定位效果

图2.2基于MSER的发票定位效果

南京邮电大学专业学位硕士研究生学位论文第二章定位与识别相关工作分析7到255之间,在此操作中二值化的阈值由0开始递增最大为255,在阈值上升的过程中记录下那些变化不大或是没有变化的连通型区域,这样合并后的区域就是MSER区域。利用MSER的特点进行文本区域定位时,能够将文本背景图....


图2.3FCN网络结构

图2.3FCN网络结构

南京邮电大学专业学位硕士研究生学位论文第二章定位与识别相关工作分析8FCN在CNN的基础上,将CNN的最后的全连接层换成了卷积层,从而保证输入图像后输出已经标签好的输出图片,实现了end-to-end的直接分割。这样既保留了原始像素空间反映出来的特征还同时获得了整体的像素空间反映....


图2.4RPN流程

图2.4RPN流程

动到特征图像的某一位置时,滑动窗口的中心点所在的特征图像的位置正好与原始输入文本图像矩阵的其中某部分子矩阵形成映射。其中原始图像当前区域以中心点为基准生成k个候选文本框,k是候选框参数表示候选框数目,大小视实际场景而定。其这些候选框的面积大小不同,边长也有区别,但都是规整的矩形框....



本文编号:3923125

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3923125.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3fef0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com