融合全局与局部信息的显著性目标检测

发布时间:2021-08-24 03:01
  视觉显著性目标检测是利用计算机技术模仿人类的视觉注意力机制,提取复杂图像中感兴趣的信息并优先处理,从而有助于提高图像处理的效率,目前已经被广泛应用到视频压缩、图像识别和检索等各个领域。显著性目标检测算法包括传统的检测算法与基于深度学习的检测算法,传统的检测算法仅仅依赖底层特征从而导致显著图自信度不高,基于深度学习的检测算法提高了显著目标的自信度,但大量池化操作会导致显著对象轮廓模糊。本文研究了一种融合全局与局部信息的显著性检测模型,能够有效获取复杂场景中的显著目标,提高显著性检测模型的鲁棒性。本文的主要工作包括:(1)针对全卷积网络中大量池化操作导致低层信息被忽略,引起显著目标边缘模糊的问题,研究了一种融合多尺度特征图细化显著对象边缘的检测模型,通过提取低层卷积组下不同尺度的特征图,并基于低层特征信息与高层抽象语义特征的互补关系,将不同尺度的特征图与全卷积网络检测的显著图进行加权融合获得全局性显著图,从而优化显著目标边界。在标准数据集上与其他检测算法对比实验,结果验证了该模型能够有效克服全卷积网络模型检测边缘模糊的问题。(1)为了进一步优化全局性显著图的边界,研究了一种融合全局与局部信... 

【文章来源】:西安理工大学陕西省

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

融合全局与局部信息的显著性目标检测


注意焦点示例图

结构图,网络模型,结构图,通道


?泳踝樵?014年提出,与其他卷积网络模型最明显的不同之处在于卷积层采用了3*3的小卷积核,从而增加了网络的层次影响网络的性能,同时导致参数量减少,能够提取一些更加高级抽象的语义特征,有利于提高对显著对象的分析理解,对于更复杂的模式能够更好的进行训练;池化层采用2*2大小的池化核。整个网络随着网络层数的增加,网络通道由原始图像的3通道逐渐变为64通道、128通道、256通道、512通道。经典VGG网络模型主要包括VGG16和VGG19两种模型,其中VGG16网络模型主要包括了5组卷积组和3层全连接层。网络结构如图2-2所示。图2-2VGG16网络模型结构图Fig.2-2ThearchitectureofVGG16networkmodel

结构图,网络模型,结构图,卷积


理论基础11与VGG16网络模型相比较,VGG19网络在后三组卷积组增加了3层卷积层,提高了网络的深度,如图2-3所示。图2-3VGG19网络模型结构图Fig.2-3ThearchitectureofVGG19networkmodel在网络模型中卷积层[31]是最主要的部分,通过图像局部相似的特点进行特征的自主学习,模拟人类视觉系统的局部感受野,卷积层中每层的神经元节点与上一层神经元节点部分连接,利用局部连接的方式很好地减少网络模型训练过程中的参数计算复杂度。每层卷积层的参数由一系列的滤波器组成,通过对输入图像进行卷积学习从而提取到显著对象的特征,获取每层卷积层的特征映射图,同时随着深度增加,能够提取图像高层次的语义特征,每层的节点输出定义如下:inniinininbkxfx,1(2-1)其中,n代表第n卷积核;i代表第i层卷积层;inx为目前的特征映射图;i1-nx为上一层的特征映射图;iink,为当前层的第n个卷积核;f为激活函数;inb为偏置。池化层也叫下采样层,主要用来删除冗余信息减小参数数据量,选出最具有代表性的特征的像素,防止训练过程中的过拟合问题。每层节点输出定义如下:inssinininbxsskfx11(2-2)其中,n代表第n池化核;i代表第i层池化层;S为下采样模板的长度;ink为模板的权值;i1-nx为上一层的特征映射图;inb为偏置。通常多采用最大池化层(MaxPooling)和均值池化层(AveragePooling),在区域内获取特征值的最大值或者平均值提取特征,从而过滤冗余信息,实现降维。全连接层是将经过一系列卷积层与池化层的特征映射进行连接作为最后的输出,将连


本文编号:3359145

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3359145.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b2443***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com