基于结构特征增强的图像显著性检测方法研究
发布时间:2021-10-09 11:34
随着科技的发展,网络化、智能化开始渗透到各个行业并逐渐影响着我们的日常生活。很多行业已经通过技术的进步解放了人们的双手,机器代替了传统繁杂而重复的工作,很多要花费大量人力,甚至使用人力无法进行的工作在机器的帮助下可以很好的完成。其中,计算机视觉技术作为计算机重要的感知手段,在很多行业发挥着独特且重要的作用。计算机视觉模拟了人类视觉感知的方式,通过对图像、视频等多媒体数据的处理,进而获取到人们需要的场景信息,形象的说,计算机视觉就像是机器的视觉系统,使得机器能够感知环境,为人类观察或传送给下一阶段设备进行决策提取帮助。计算机视觉模拟人类视觉系统,使机器可以像人类一样观察和理解图片,一个关键任务就是显著性检测。人类能够很快的在丰富的视觉场景中找到少量的重要信息,对应到计算机视觉上,就是显著性检测这个任务。目前大多数显著性检测的研究成果是基于全卷积深度神经网络的。全卷积神经网络通过叠加大量的卷积层和池化层获取丰富的语义特征,但是其中存在着一个隐患——空间结构缺失。池化层能够扩大特征提取的感受野、获取语义上下文信息,但它也造成了图片空间结构信息的损失。在一些逐像素的检测任务中,要求输出图与原图...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
抖音短视频数据中挖
著性检测任务提出了大量的网络结构。一些实验[16,17,18]表明,如图 1-4 所示,深度卷积网络的深层能够获取到高级特征编码语义信息以获得对象的抽象描述,而浅层的低级特征保留空间细节以重建对象边界。因此,一些研究将多层次特征引入显著性检测。文献[16]提出了一种利用深层监督的方法,在不同层次的卷积模块引入显著性检测监督信号,得到多尺度的显著性检测结果,然后将这些显著性图进行融合得到最终的显著性图。文献[17]提出了一种基于循环递进的显著性检测方法,逐渐逼近真值图的结果。文献[18]通过对不同尺度特征之间建立短连接,结合深层监督,融合多尺度特征,细化显著性检测结果。文献[19]通过在不同尺度直接连接高层次和低层次的特征图来聚合多层次特征,然后结合多尺度信息以达到好的结果。文献[20]提出一个双向消息传递模块,在该模块中,消息可以通过门函数进行控制传输。国内清华大学[21],中国科学技术大学[22,23],哈尔滨工业大学[24],大连理工大学[25],北京交通大学[26],吉林大学[27],武汉大学[28]等多个国内外知名高校对显著性检测研究有着重要贡献。一些知名企业的 AI 研究院也积极研究这个方向,微软,阿里 AI 研究院,腾讯优图实验室,商汤等都在显著性检测方面有重要贡
.3 目前显著性检测方法缺陷分析目前大多数显著性检测的研究成果是基于全卷积深度神经网络(FCN)的用卷积神经网络进行显著性检测存在着一个隐患——池化层(pooling laye化层能够扩大特征提取的感受野、获取语义上下文信息,但它也造成了图间结构信息的损失。基于图像的显著性检测要求输出的显著性图与原图大致,因此需要保留空间结构信息。目前大体上有两种不同结构来解决该问题第一个是编码器-解码器结构(encoder-decoder structure)。编码器(Encode堆叠卷积层和池化层进而减少特征的尺寸,解码器(Decoder)通过跳层链接修复高层特征中丢失的细节特征。U-Net[40]图 1-5 是这种方法中最常用的。Encoder 和 Decoder 之间通常存在短连接,因此能帮助 Decoder 更好地修标的细节。第二种方法使用空洞卷积(atrous/dilated convolutions)[41]来替代池化层图 1-6 所示,一般的卷积如图 1-6 第一张图所示,卷积时计算中间是密集的空洞卷积在卷积时卷积核与图像计算中间有空隙。显然,这样做在卷积操
【参考文献】:
期刊论文
[1]基于鲁棒主成分分析和多个色彩通道的显著性检测[J]. 马小龙,谢旭东,林健文,钟宜生. 清华大学学报(自然科学版). 2014(08)
博士论文
[1]基于视觉显著性的显著区域提取方法及其应用研究[D]. 梁晔.北京交通大学 2018
[2]视觉显著性检测模型研究及应用[D]. 林名强.中国科学技术大学 2016
[3]基于视觉显著性的目标检测方法与应用研究[D]. 刘君玲.吉林大学 2014
[4]视觉显著性检测关键技术研究[D]. 景慧昀.哈尔滨工业大学 2014
[5]视觉显著性应用研究[D]. 敖欢欢.中国科学技术大学 2013
硕士论文
[1]视觉显著性物体检测算法研究[D]. 叶子童.武汉大学 2018
[2]基于稠密和稀疏重构的图像显著性检测算法[D]. 李晓晖.大连理工大学 2014
本文编号:3426288
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
抖音短视频数据中挖
著性检测任务提出了大量的网络结构。一些实验[16,17,18]表明,如图 1-4 所示,深度卷积网络的深层能够获取到高级特征编码语义信息以获得对象的抽象描述,而浅层的低级特征保留空间细节以重建对象边界。因此,一些研究将多层次特征引入显著性检测。文献[16]提出了一种利用深层监督的方法,在不同层次的卷积模块引入显著性检测监督信号,得到多尺度的显著性检测结果,然后将这些显著性图进行融合得到最终的显著性图。文献[17]提出了一种基于循环递进的显著性检测方法,逐渐逼近真值图的结果。文献[18]通过对不同尺度特征之间建立短连接,结合深层监督,融合多尺度特征,细化显著性检测结果。文献[19]通过在不同尺度直接连接高层次和低层次的特征图来聚合多层次特征,然后结合多尺度信息以达到好的结果。文献[20]提出一个双向消息传递模块,在该模块中,消息可以通过门函数进行控制传输。国内清华大学[21],中国科学技术大学[22,23],哈尔滨工业大学[24],大连理工大学[25],北京交通大学[26],吉林大学[27],武汉大学[28]等多个国内外知名高校对显著性检测研究有着重要贡献。一些知名企业的 AI 研究院也积极研究这个方向,微软,阿里 AI 研究院,腾讯优图实验室,商汤等都在显著性检测方面有重要贡
.3 目前显著性检测方法缺陷分析目前大多数显著性检测的研究成果是基于全卷积深度神经网络(FCN)的用卷积神经网络进行显著性检测存在着一个隐患——池化层(pooling laye化层能够扩大特征提取的感受野、获取语义上下文信息,但它也造成了图间结构信息的损失。基于图像的显著性检测要求输出的显著性图与原图大致,因此需要保留空间结构信息。目前大体上有两种不同结构来解决该问题第一个是编码器-解码器结构(encoder-decoder structure)。编码器(Encode堆叠卷积层和池化层进而减少特征的尺寸,解码器(Decoder)通过跳层链接修复高层特征中丢失的细节特征。U-Net[40]图 1-5 是这种方法中最常用的。Encoder 和 Decoder 之间通常存在短连接,因此能帮助 Decoder 更好地修标的细节。第二种方法使用空洞卷积(atrous/dilated convolutions)[41]来替代池化层图 1-6 所示,一般的卷积如图 1-6 第一张图所示,卷积时计算中间是密集的空洞卷积在卷积时卷积核与图像计算中间有空隙。显然,这样做在卷积操
【参考文献】:
期刊论文
[1]基于鲁棒主成分分析和多个色彩通道的显著性检测[J]. 马小龙,谢旭东,林健文,钟宜生. 清华大学学报(自然科学版). 2014(08)
博士论文
[1]基于视觉显著性的显著区域提取方法及其应用研究[D]. 梁晔.北京交通大学 2018
[2]视觉显著性检测模型研究及应用[D]. 林名强.中国科学技术大学 2016
[3]基于视觉显著性的目标检测方法与应用研究[D]. 刘君玲.吉林大学 2014
[4]视觉显著性检测关键技术研究[D]. 景慧昀.哈尔滨工业大学 2014
[5]视觉显著性应用研究[D]. 敖欢欢.中国科学技术大学 2013
硕士论文
[1]视觉显著性物体检测算法研究[D]. 叶子童.武汉大学 2018
[2]基于稠密和稀疏重构的图像显著性检测算法[D]. 李晓晖.大连理工大学 2014
本文编号:3426288
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3426288.html