基于EAST与ASTER的自然场景图像中文本检测与识别研究
发布时间:2021-08-31 15:12
伴随着互联网时代的到来,自然场景图片的获取与存储越来越便捷,自然场景图片记录着人们的生活以及重要的信息。图片中的文字蕴含有丰富的语义信息,如何从自然场景图像中准确的提取出文字在视频检索、车牌识别、导航系统、工业生产自动化等领域具有重要的应用价值。不同于文档图像,自然场景图像的背景复杂、图片的清晰度差异大,文字区域的规则多样化使得传统的OCR技术无法应用到自然场景中的文字识别上。近年来基于深度学习的技术渗透到各个应用场景,本文结合现有流行的EAST文本检测算法和ASTER文本识别技术,对自然场景图片中文字的提取进行了研究。首先,针对感受野能力不足的问题,本文实现了一种改进的EAST文本检测模型,该模型利用深度残差网络抓取更深层的图像特征,特征融合前在输出步长为8和16的特征映射层后加入ASPP模块进行感受野的扩张,接着通过双线性上采样到合适尺寸与浅层的特征映射串联进行特征融合,最后通过卷积输出到输出层。在网络的训练上,本文修改了损失函数通过结合Focal Loss和Dice loss两大损失函数进行网络的训练。通过在实验数据上的检测证明该模型能很好地完成在自然场景下的文本检测功能。然后,...
【文章来源】:武汉邮电科学研究院湖北省
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
验证集上损失函数值
整流网络实
ASTER与本文识别算法训练Loss下降过程
【参考文献】:
期刊论文
[1]基于改进EAST的自然场景文本定位算法[J]. 杨飚,杜晓宇. 计算机工程与应用. 2019(18)
[2]卷积神经网络CNN算法在文本分类上的应用研究[J]. 侯小培,高迎. 科技与创新. 2019(04)
[3]自然场景图像中的文本检测综述[J]. 王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽. 自动化学报. 2018(12)
[4]复杂场景文本段识别[J]. 王孝男,张利,何思楠. 计算机应用研究. 2019(09)
[5]卷积神经网络在车辆识别中的应用[J]. 彭清,季桂树,谢林江,张少波. 计算机科学与探索. 2018(02)
[6]基于深度学习方法的复杂场景下车辆目标检测[J]. 宋焕生,张向清,郑宝峰,严腾. 计算机应用研究. 2018(04)
[7]卷积神经网络在印章编号识别中的应用[J]. 阳哲. 现代计算机(专业版). 2016(04)
博士论文
[1]基于卷积神经网络的计算机视觉关键技术研究[D]. 李彦冬.电子科技大学 2017
[2]面向不平衡数据的支持向量机分类方法研究[D]. 杨智明.哈尔滨工业大学 2009
硕士论文
[1]自然场景图像中的文本检测与识别技术研究[D]. 周鹏飞.西安理工大学 2019
[2]基于深度学习的自然场景文本检测算法研究[D]. 张艾萱.北方工业大学 2019
[3]文本检测模型在视频场景中的字幕召回问题研究[D]. 刘钰涛.华中科技大学 2019
[4]复杂自然场景中文本检测技术的研究[D]. 黄梅玲.南京邮电大学 2018
[5]基于深度学习的自然场景文本定位与识别研究[D]. 张平.西安电子科技大学 2018
[6]自然场景下的文本检测算法研究[D]. 王志元.江西理工大学 2018
[7]基于深度学习的自然场景文本检测与识别[D]. 方清.电子科技大学 2018
[8]基于卷积神经网络的ECG身份识别技术研究[D]. 徐雯静.东北林业大学 2016
[9]自然场景中的文本检测研究[D]. 刘可豹.北京交通大学 2015
本文编号:3375116
【文章来源】:武汉邮电科学研究院湖北省
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
验证集上损失函数值
整流网络实
ASTER与本文识别算法训练Loss下降过程
【参考文献】:
期刊论文
[1]基于改进EAST的自然场景文本定位算法[J]. 杨飚,杜晓宇. 计算机工程与应用. 2019(18)
[2]卷积神经网络CNN算法在文本分类上的应用研究[J]. 侯小培,高迎. 科技与创新. 2019(04)
[3]自然场景图像中的文本检测综述[J]. 王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽. 自动化学报. 2018(12)
[4]复杂场景文本段识别[J]. 王孝男,张利,何思楠. 计算机应用研究. 2019(09)
[5]卷积神经网络在车辆识别中的应用[J]. 彭清,季桂树,谢林江,张少波. 计算机科学与探索. 2018(02)
[6]基于深度学习方法的复杂场景下车辆目标检测[J]. 宋焕生,张向清,郑宝峰,严腾. 计算机应用研究. 2018(04)
[7]卷积神经网络在印章编号识别中的应用[J]. 阳哲. 现代计算机(专业版). 2016(04)
博士论文
[1]基于卷积神经网络的计算机视觉关键技术研究[D]. 李彦冬.电子科技大学 2017
[2]面向不平衡数据的支持向量机分类方法研究[D]. 杨智明.哈尔滨工业大学 2009
硕士论文
[1]自然场景图像中的文本检测与识别技术研究[D]. 周鹏飞.西安理工大学 2019
[2]基于深度学习的自然场景文本检测算法研究[D]. 张艾萱.北方工业大学 2019
[3]文本检测模型在视频场景中的字幕召回问题研究[D]. 刘钰涛.华中科技大学 2019
[4]复杂自然场景中文本检测技术的研究[D]. 黄梅玲.南京邮电大学 2018
[5]基于深度学习的自然场景文本定位与识别研究[D]. 张平.西安电子科技大学 2018
[6]自然场景下的文本检测算法研究[D]. 王志元.江西理工大学 2018
[7]基于深度学习的自然场景文本检测与识别[D]. 方清.电子科技大学 2018
[8]基于卷积神经网络的ECG身份识别技术研究[D]. 徐雯静.东北林业大学 2016
[9]自然场景中的文本检测研究[D]. 刘可豹.北京交通大学 2015
本文编号:3375116
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3375116.html
最近更新
教材专著