当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的自然场景中文本检测方法研究

发布时间:2021-09-24 11:42
  自然场景中的文字信息具有明确的语义,有助于对自然场景内容的理解和分析。近几年,自然场景中的文本检测和识别作为计算机视觉领域中的重要研究方向,引起了国内外学者和研究机构的广泛关注,其成果可以广泛应用于场景分类、机动车自动驾驶、机器人视觉等领域。其中,自然场景中的文本区域检测和定位的结果会直接影响下一步文字识别的准确率。现有的文本检测技术大多都是根据文字自身结构特点进行人工的特征提取,然后再结合机器学习的方法来检测文本区域。由于自然场景非常复杂,而且自然场景中的文字具有多样性,因此,这种人工特征通常只适用于特定条件下的场景,整体的检测准确率较低。随着深度神经网络的发展和成熟,很多学者和研究机构设计了不同的文本检测网络模型来实现端到端的文本定位。与前面的传统方法相比,检测性能有了大幅提升,但是特征学习阶段较耗时。因此,本文深入研究了自然场景中文本的传统特征及深度网络特征的提取方法,将传统特征与深度网络特征融合,用传统特征去指导深度网络特征的提取,以提高深度网络提取特征的速度。本学位论文的主要研究内容如下:首先,根据带有复杂背景的实际自然场景图像中文本所具有的多语言、多方向、多尺度、多形态的特... 

【文章来源】:延边大学吉林省 211工程院校

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于深度学习的自然场景中文本检测方法研究


图2-1?MSER区域提取示意图??.-

示意图,产生过程


?j??Ra??图2-1?MSER区域提取示意图??Fig.?2-1?Schematic?map?of?MSER?region?extraction??检测连通区域的面积变化快慢方法如式(2-3)所示。??v(/)?=?|Q+a-Q-a|?(2-3)??Q,??其中阈值变化为A(相当于注水过程),2,表示第f个连通区域面积,当??区域面积变化量与原区域面积比值为局部最小值时区域面积最稳定。??Step3:在得到的MSER区域中进行区域清理,处理掉面积或变化率过大??或过小的区域。提取的区域会存在一定的尺度、旋转差异以及扭曲变形等,??然后对不规则区域进行椭圆化处理,将其调整为规则仿射不变区域,如图??2-2。最后可以将椭圆形拟合再归一化为圆形,然后放大MSER区域,可以方??便后续的处理过程[39]。??身??图2-2椭圆化处理??Fig.?2-2?Ellpticalization??图像文本字符区域像素点具有相对统一的亮度且不同于背景区域,该??属性与极值区域相同

文字,文本检测,文本区,尺寸变化


图2-4文本检测FCN结构??Fig.?2-4?Structure?of?text?detection?FCN??由于文本区域的文字尺寸变化很大,在祌经网络中尺寸较大的文字特??征依赖于后期的特征提取阶段,而在预测对小单词区域的精确几何形状时??需要的是前期阶段的低级特征信息。因此在设计神经网络模型时为满足这??些条件,采用了?U-shape[52^、想。??第一部分结构采用PVANet,提取四个阶段的特征图,大小分别为输??入图像的?1/32,1/16,1/8?和?1/4。即从?VGG16?中?pooling2-pooling5?的每??一层中分别得到feature?map/。??第二部分借鉴U-net思想进行特征合并,通过反卷积操作调整特征图??大小进行连接,计算公式如式(2-24)和(2-25)所示。特征合并过程首先以第??一阶段最后生成的特征图/开始,逐步将/输入到unpooling层得到与上??一层大小相同的特征图再连接/+1,然后进入到convl?xl与conv3><3中减少??

【参考文献】:
期刊论文
[1]多尺度卷积特征融合的SSD目标检测算法[J]. 陈幻杰,王琦琦,杨国威,韩佳林,尹成娟,陈隽,王以忠.  计算机科学与探索. 2019(06)
[2]基于全局和局部卷积特征融合的车辆目标检测[J]. 黄俊洁,陈念年,范勇.  西南科技大学学报. 2018(04)
[3]基于特征融合网络的自然场景文本检测[J]. 余峥,王晴晴,吕岳.  计算机系统应用. 2018(10)
[4]应用MSER和局部二值化的网络图片文本定位[J]. 刘美华,傅彩明,梁开健,周细凤.  光电子·激光. 2018(06)
[5]基于MSER特征的无人机倾斜影像匹配算法[J]. 韩宇.  矿山测量. 2018(02)
[6]一种基于MSER的仿射不变二进制特征提取算法[J]. 胡汉莉,席志磊.  计算机与数字工程. 2018(01)
[7]联合边缘增强的MSER自然场景文本检测[J]. 田清越,高志荣,熊承义,陈少波.  小型微型计算机系统. 2017(11)
[8]多方向自然场景文本检测[J]. 何思楠,郭永金,张利.  计算机应用研究. 2018(07)
[9]基于视觉显著性与边缘密集度的文本区域定位[J]. 张鹏,崔荣一.  吉林大学学报(信息科学版). 2017(03)
[10]结合MSCRs与MSERs的自然场景文本检测[J]. 易尧华,申春辉,刘菊华,卢利琼.  中国图象图形学报. 2017 (02)

博士论文
[1]基于视觉注意的驾驶场景显著性检测模型研究[D]. 邓涛.电子科技大学 2018
[2]复杂背景图像的文本信息提取研究[D]. 孙巧榆.华东师范大学 2012

硕士论文
[1]基于深度学习的场景图像文本检测技术[D]. 裴宸平.河南大学 2018
[2]基于MSER和随机森林的实时交通标志的检测和识别[D]. 付文彬.江西理工大学 2018
[3]基于深度学习的自然场景文本检测算法研究[D]. 王沉燕.杭州电子科技大学 2018
[4]基于MSER的自然场景文本定位算法研究[D]. 付程琳.西安科技大学 2017
[5]结合MSCRs与MSERs的复杂背景图像文本检测方法研究[D]. 申春辉.武汉大学 2017
[6]复杂场景下的视觉目标跟踪研究[D]. 刘行.江南大学 2017
[7]视频显著区域检测研究[D]. 田赛.西安电子科技大学 2015
[8]复杂目标视觉注意模型研究[D]. 暴林超.华中科技大学 2011



本文编号:3407694

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3407694.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ee102***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com