当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的场景文本检测的研究

发布时间:2021-01-08 05:58
  自然场景图像中的文本包含着丰富而精准的语义信息,是图像中重要的信息来源,这使检测和识别场景图像中的文本成为一个具有巨大应用价值的研究主题。近年来,场景文本的检测和识别得到了越来越多研究者的关注,在该领域不断有新的方法被提出。早期的场景文本检测识别方法基本上都是基于人工设计的特征的,随着深度学习的复兴,深度网络强大的特征学习能力使基于深度学习,特别是基于卷积神经网络的方法逐渐成为该领域的主流。在该背景下,本文的主要工作是,基于深度卷积网络对场景文本检测问题进行研究。本文针对于多尺度场景文本尤其是小文本检测的问题,提出了一个新的场景文本检测框架——基于特征金字塔的场景文本检测器。该框架基于通用目标检测领域的SSD框架,并引入特征金字塔机制,通过一种自顶向下特征融合方法,将卷积神经网络中不同深度的特征进行融合产生新的特征,使这些新特征在具有较强判别力的同时又保留较多图像的局部细节信息。通过在新特征上进行文本检测,使该框架在检测多尺度文本尤其是小文本方面的效果得到了提升。该方法在ICDAR2013数据集上达到87.6%的F-score。目前大多数基于深度网络的场景文本检测方法需要大量拥有包围盒... 

【文章来源】:北京工业大学北京市 211工程院校

【文章页数】:85 页

【学位级别】:硕士

【部分图文】:

基于深度学习的场景文本检测的研究


FasterR-CNN中的RPNFigure2-4RPNinFasterR-CNN

检测流程


图 2-5 SSD 检测流程Figure 2-5 Detection pipeline of SSD与 R-CNN 系列方法只在 CNN 最高层 feature map 上进行检测不同,SSDN 中多个不同层的 feature map 上分别进行检测来解决多尺度问题。在这ature map 中,随着 CNN 的加深,feature map 的尺寸越来越小,而与该 feaap 相关联的 default box 的尺寸则越来越大。图 2-6 给出了示例,其中图(a)中框表示 ground-truth,图(b)(c)中的虚线框表示 feature map 某个位置所关联fault box,虚线框为红色表示 default box 与 ground-truth 相匹配。可以看出8 的 feature map 相关联的 default box 尺寸都过小,无法包围到输入图像中ound-truth,而在与 4×4 的 feature map 相关联的 default box 中可以找到合适匹配 ground-truth。也就是说,SSD 的这种在不同层次 feature map 上设置不度 defaultbox 的设计,可以有效地提高 defaultbox 匹配到不同尺度 ground-可能性。这对于整个框架来说是非常重要的,因为无论是训练还是测试,能功进行的一个重要前提是,default box 总能匹配到 ground-truth。

网络结构图,网络结构,卷积


图 3-1 FPTD 网络结构Figure 3-1 The architecture of FPTD中的相似,是一个经过调整之后的 VGG-16 网络[47]。主干网络与 VGG-16 的结构配置对比在表 3-1 中展示,其中,卷积层的参数格式为[k×k, p, s, c](k:卷积核尺寸,p:填充大小,s:步长,c:输出通道数),最大池化层参数格式为[k×k,p,s],全连接层参数格式为[c](c:输出神经元个数)。由表 3-1 可以看出,FPTD 的主干网络是一个由 21 个可学习层(全部为卷积层)构成的 CNN。其中,前 13 层直接继承了 VGG-16 网络的前 13 层配置(conv1_1~conv5_3)。在此基础上,对 VGG-16 进行如下调整:(1) 将 pool5 的池化步长由 2 变为 1,池化窗口由 2×2 变为 3×3。该改动使feature map 的分辨率在这一层得到保持。(2) 将 fc6 和 fc7 这两个全连接层换为卷积层 conv6 和 conv7。其中,conv6层使用了atrous卷积[51]对featuremap进行稀疏采样。该层结合第(1)步中的做法,


本文编号:2964052

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2964052.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7172b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com