基于深度学习的票据检测和识别算法研究

发布时间:2024-12-27 06:32
  自然场景票据识别是对手机拍摄的票据图像进行文本识别的过程,从收据和发票中提取关键文本,并将文本内容保存,有利于进行高效存档、快速索引、文档分析和票据复查等业务。随着深度学习的发展,自然场景文本识别任务(如车牌识别,场景文字识别)在准确率和处理速度方面均有所突破,但票据文本识别比一般的识别任务要求更高的精确度,并且由于票据种类多样,模板框架众多,所以很难找到一种统一的方法检测所有类型票据,对于票据内容偏移打印、印章遮盖文字等低质量票据更是加大了识别难度。为了适应不同模板类型的票据,本文整体识别过程包括图像倾斜校正、印章去除、识别单元定位分割、文字识别等部分。论文主要研究内容如下:(1)为了提取有效识别单元,减少票据框线对定位精度的影响,本文对比现有定位方法如EAST、CTPN等场景文本定位算法的优劣,利用CTPN网络定位文本位置,并对网络输出结果进行改进,将满足给定垂直重叠率条件的文本行合并;为了分割距离较近但属于不同单元的文本,改进垂直投影算法,根据判别条件的不同选择不同的分割策略,得到属于相同单元的文本内容。(2)由于票据上均有印章,当印章与文字存在交叠时,会影响字符识别准确率,因此本...

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

图1-1各种类型票据(

图1-1各种类型票据(

哈尔滨理工大学工学硕士学位论文-6-所示,本文对票据个人信息做模糊遮挡处理。a)有框线,存在偏移打印和文字重叠b)有框线存在偏移打印c)无框线,存在偏移打印d)有框线存在文字重叠图1-1各种类型票据(个人关键信息遮挡)Fig.1-1Varioustypesofbill(perso....


图1-2印章盖在文字上Fig.1-2Stampontext

图1-2印章盖在文字上Fig.1-2Stampontext

哈尔滨理工大学工学硕士学位论文-6-所示,本文对票据个人信息做模糊遮挡处理。a)有框线,存在偏移打印和文字重叠b)有框线存在偏移打印c)无框线,存在偏移打印d)有框线存在文字重叠图1-1各种类型票据(个人关键信息遮挡)Fig.1-1Varioustypesofbill(perso....


图1-3票据文字与框线交叠Fig.1-3Thetextofthebilloverlapswiththeframeline

图1-3票据文字与框线交叠Fig.1-3Thetextofthebilloverlapswiththeframeline

第1章绪论-7-图1-3票据文字与框线交叠Fig.1-3Thetextofthebilloverlapswiththeframeline1.4本文的研究内容票据自动识别在票据账单复核和内容保存中必不可少。为了提高票据文本识别结果,准确识别不同种类票据,本文主要处理流程如图1-4所....


图2-2倾斜校正结果

图2-2倾斜校正结果

哈尔滨理工大学工学硕士学位论文-12-e)仿射变换图2-2倾斜校正结果Fig.2-2Resultsoftiltcorrection2.2彩色空间2.2.1RGB模型RGB模型是工业界采用的一种颜色标准,颜色模型如图2-3所示,根据红(Red)、绿(Green)、蓝(Blue)3个....



本文编号:4021282

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4021282.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户102d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com