基于深度学习的税务票据自动识别系统的研究及实现
发布时间:2021-03-02 21:44
现代工业、商业、日常经济活动的繁荣,促使人们频繁使用发票等税务票据,而常规手动管理税务票据费事费力,随着信息技术的发展,这项工作大多交由计算机完成,而传统的人工手动录入税务票据信息的方式,面对急剧增长的税务票据,无法满足人们的要求,且错误率高、时效性差。因此借助信息化手段,提高税务票据信息处理能力,处理效率,准确率,实现税务票据自动识别是解决问题的有效办法。税务票据识别是字符识别技术的实践与应用。本课题首先整理总结了国内外字符识别技术的现状及研究方法,重点介绍了基于神经网络的深度学习方法。并对税务票据自动识别系统进行需求分析、业务流程、架构设计及实现,提出基于Dense Convolutional Network(DenseNet)加 Bidirectional-LSTM(BLSTM)的税务票据内容识别模型。主要工作内容如下:(1)针对税务票据图像的预处理问题,采用OpenCV对图像进行灰度化处理去除不必要的彩色信息;再采用自适应中值滤波器对图像进行降噪处理去除噪音;采用Radon变化对图像进行倾斜校正;最后对图像进行分割定位以便精确提取所需内容。(2)针对税务票据的内容识别问题,仔细...
【文章来源】:中国科学院大学(中国科学院人工智能学院)北京市
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图2.1神经元数学模型示意图??Figure?2.?1?Neuronal?Mathematical?Model??
?经网络中的处理单元对应生物神经网络的神经元,受生物神经网络动作电位和静??息的产生机制原理启发建立的数学运算模型。图2.2展示的是人工神经网络组成??的示意图,在图中,输入是源输入或者上层神经元的输出,输入与权重相乘,再??求和。权值为正表示兴奋,值越大表示作用越强,负值的权重则为抑制,越小抑??制越弱。将全部的累加与阈值对比,累加大于阈值,结果是一,反之,结果是零。??图2.?2人工神经网络的组成示意图??Figure?2.2?Composition?of?Artificial?Neural?Networks??2.1.1激活函数??在神经网络中激活函数可以选择不同的激活函数,传统的激活函数有??Sigmoid函数[21]、tanh函数等。??(1)?S型函数??=?sigm(x)?=?—5—?(2.?1)??\?+?ex??任意输入信号都可以通过Sigmoid函数进行变换,其是非线性激活函数,功??能是将输入压缩至〇到1之间,即被转换成一个取值介于〇到1之间的输出值,而不??是将分类结果简单分为0和〗,输出结果是介于二者的概率,因此,Sigmoid函数??的最大的特点是无限拟合非线性的输入与输出。在训练集上
发表后很快在模式识别、图像识别、语音识别、自然语言处理等领域有了不俗的??表现。20世纪80年代日本学者K.FukuShima第一次实际构建了卷积神经网络,并??之后致力于研究对卷积神经网络的结构优化。卷积神经网络的结构如图2.3所示。??卷积神经网络结构主要组成部分包括输入层、卷积层、全连接层、输出层。??特征映w?特扯映射??(!*28心?10*10*10?UI.映?M?谄出??输入犯咖?????p?隱⑷?2^*1??Ml?了仙样?投积?了杣样?S积??图2.3卷积神经网络结构图??Figure?2.3?Structural?diagram?of?convolutional?neural?network??(1)输入层:原始信息可以直接作为卷积网络的输入,当输入是图像时,??输入数据就是图像的像素值,当输入是数据时,输入数据就是输入向量。??(2)
【参考文献】:
期刊论文
[1]深度神经网络的发展现状[J]. 胡聪丛,胡桓. 电子技术与软件工程. 2017(04)
[2]通用机打商业发票识别系统研究与实现[J]. 虞飞,皮佑国. 信息技术. 2013(06)
[3]三种基于GDI+的图像灰度化实现方法[J]. 李贞培,李平,郭新宇,陈树敏. 计算机技术与发展. 2009(07)
[4]基于Radon变换的倾斜车牌图像角度检测与校正[J]. 孙东卫,朱程辉. 微计算机应用. 2008(02)
[5]开放源代码的计算机视觉类库OpenCv的应用[J]. 黎松,平西建,丁益洪. 计算机应用与软件. 2005(08)
[6]票据印刷纵横谈[J]. 彭卫东. 今日印刷. 2003(08)
本文编号:3060005
【文章来源】:中国科学院大学(中国科学院人工智能学院)北京市
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图2.1神经元数学模型示意图??Figure?2.?1?Neuronal?Mathematical?Model??
?经网络中的处理单元对应生物神经网络的神经元,受生物神经网络动作电位和静??息的产生机制原理启发建立的数学运算模型。图2.2展示的是人工神经网络组成??的示意图,在图中,输入是源输入或者上层神经元的输出,输入与权重相乘,再??求和。权值为正表示兴奋,值越大表示作用越强,负值的权重则为抑制,越小抑??制越弱。将全部的累加与阈值对比,累加大于阈值,结果是一,反之,结果是零。??图2.?2人工神经网络的组成示意图??Figure?2.2?Composition?of?Artificial?Neural?Networks??2.1.1激活函数??在神经网络中激活函数可以选择不同的激活函数,传统的激活函数有??Sigmoid函数[21]、tanh函数等。??(1)?S型函数??=?sigm(x)?=?—5—?(2.?1)??\?+?ex??任意输入信号都可以通过Sigmoid函数进行变换,其是非线性激活函数,功??能是将输入压缩至〇到1之间,即被转换成一个取值介于〇到1之间的输出值,而不??是将分类结果简单分为0和〗,输出结果是介于二者的概率,因此,Sigmoid函数??的最大的特点是无限拟合非线性的输入与输出。在训练集上
发表后很快在模式识别、图像识别、语音识别、自然语言处理等领域有了不俗的??表现。20世纪80年代日本学者K.FukuShima第一次实际构建了卷积神经网络,并??之后致力于研究对卷积神经网络的结构优化。卷积神经网络的结构如图2.3所示。??卷积神经网络结构主要组成部分包括输入层、卷积层、全连接层、输出层。??特征映w?特扯映射??(!*28心?10*10*10?UI.映?M?谄出??输入犯咖?????p?隱⑷?2^*1??Ml?了仙样?投积?了杣样?S积??图2.3卷积神经网络结构图??Figure?2.3?Structural?diagram?of?convolutional?neural?network??(1)输入层:原始信息可以直接作为卷积网络的输入,当输入是图像时,??输入数据就是图像的像素值,当输入是数据时,输入数据就是输入向量。??(2)
【参考文献】:
期刊论文
[1]深度神经网络的发展现状[J]. 胡聪丛,胡桓. 电子技术与软件工程. 2017(04)
[2]通用机打商业发票识别系统研究与实现[J]. 虞飞,皮佑国. 信息技术. 2013(06)
[3]三种基于GDI+的图像灰度化实现方法[J]. 李贞培,李平,郭新宇,陈树敏. 计算机技术与发展. 2009(07)
[4]基于Radon变换的倾斜车牌图像角度检测与校正[J]. 孙东卫,朱程辉. 微计算机应用. 2008(02)
[5]开放源代码的计算机视觉类库OpenCv的应用[J]. 黎松,平西建,丁益洪. 计算机应用与软件. 2005(08)
[6]票据印刷纵横谈[J]. 彭卫东. 今日印刷. 2003(08)
本文编号:3060005
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3060005.html
最近更新
教材专著