基于深度与宽度神经网络显著性检测方法研究

发布时间:2021-08-21 05:44
  图像显著性检测就是将图像中最重要区域分割出来。解决图像显著性检测问题通常涉及计算机视觉、神经科学,认知心理学等领域的知识。近年来,随着深度学习在计算机视觉领域取得了巨大的成就,深度学习的应用在图像显著性检测课题中也发挥了良好的效果,因此基于深度卷积神经网络的算法已成为解决图像显著性检测的最有效的方法。但就目前的基于深度卷积神经网络的显著性算法而言,其大多采用非常复杂的深度卷积网络模型在做检测,这样将依赖高昂的计算设备才能完成算法的实现,使得这些算法无法被应用到计算能力较小的移动设备上也无法有效地做完成其他高级视觉问题的预处理过程。对于研究人员来说,提高基于神经网络的显著性检测算法的计算效率一般从两个角度出发,一是裁剪网络结构,同时结合传统特征提取方法进行处理。另一种则是采用一种更轻量化的网络来解决显著性检测问题。根据这两点思路,本文分别提出两种高效且不失精度的基于神经网络的显著性检测算法。首先是本文提出的融合低维特征提取层的深度卷积显著性检测算法,在该方法中本文提出了一个低维特征提取层,来将输入图像预先进行特征提取并将其映射到校直的特征图以作为全卷积网络的输入。其目的是对数据进行降维来... 

【文章来源】:上海师范大学上海市

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于深度与宽度神经网络显著性检测方法研究


显著性检测示例图

功能图,手机,图片,功能


第一章绪论上海师范大学硕士论文2工智能等技术来提出一种智能、精确且高效的显著性检测算法是一件非常有价值的工作。目前为止,显著性检测作为计算机视觉领域的热门研究领域之一,已经被广泛应用到其他高级视觉领域来作为他们的预处理阶段,如立体匹配[1]、视频去模糊[2]、图像和视频压缩[3][4]、内容感知图像编辑[5]、目标识别[6]、语义分割[7]和视觉跟踪[8]等。图1-2华为手机图片虚化功能演示1.2国内外研究现状近年来,显著性检测已经成为计算机视觉、计算机图像处理领域的热门研究方向之一,不断受到国内外研究者的关注,进而也产生了很多优秀的研究成果。根据显著性的国内外发展现状,本节将从两个方面对其进行回顾,即传统显著性检测算法和基于深度卷积网络的显著性检测算法。1.2.1传统显著性检测算法显著性算法早些年的研究中,其大多是传统方法。在基于自底向上的显著性算法的发展史上具有开创性的研究最早可以追溯到上世纪90年代Itti等[10]关于IT算法的研究。该研究受Koch和Ullman提出的视觉注意力机制启发[11],提出了一种基于中心环绕(CenterSurrounding)的视觉注意力机制的计算模型,来计算图像中的显著视点。中心环绕机制的核心思想就是相对于周围的像素点,若在像素点在特征颜色(Colors),亮度(Intensity),或方向(Orientation)等特征上更加显著,则其更有可能为显著特征点。Itti的研究对基于颜色特征信息的显

搜索空间,像素


上海师范大学硕士论文第二章相关技术介绍7第二章相关技术介绍本章将对超像素分割算法,手工特征提取,深度神经网络,宽度神经网络,和后处理算法条件随机场进行详细介绍。2.1超像素分割超像素分割算法是将图像中特征相似像素聚集成区域的算法。其中有代表性的研究是Achanta等[34]提出SLIC(simplelineariterativeclustering)算法。SLIC算法的特点是根据图像里像素的颜色(R,G,B)和坐标位置(x,y)五维特征进行聚类。该聚类方式类似于K-means算法,其最终所聚成的簇即为超像素。不同的是SLIC算法在聚类时其搜索空间是有限的,而不是对每个超像素都要搜索整张图片。如图2-1所示,图2-1(a)所展示的是K-means算法的搜索空间,(a)标准K-means搜索(b)SLIC算法搜索图2-1K-means和SLIC的搜索空间的比较[34]而图2-1(b)是SLIC的搜索空间,具体地,对于一块大小为×的超像素其搜索空间为2×2,因此SLIC算法运行效率更高。SLIC算法大致过程如下:1.将图像分为个大小相等且为×的图像块(patch),每一个图像块都是一个聚类,其聚类的中心被称为超像素(superpixel)。假设图像有个像素,则每个图像块的边长S=*+。2.对聚类中心进行初始化,划分图像块后,在每个图像块的中心点的3×3区域选取梯度最小的点作为聚类中心点。这样可以防止采样到的像素点是噪声或是边缘像素。

【参考文献】:
期刊论文
[1]Salient object detection: A survey[J]. Ali Borji,Ming-Ming Cheng,Qibin Hou,Huaizu Jiang,Jia Li.  Computational Visual Media. 2019(02)
[2]BING: Binarized normed gradients for objectness estimation at 300fps[J]. Ming-Ming Cheng,Yun Liu,Wen-Yan Lin,Ziming Zhang,Paul L.Rosin,Philip H.S.Torr.  Computational Visual Media. 2019(01)
[3]基于稳定树的立体匹配视差优化算法[J]. 季雨航,马利庄.  计算机辅助设计与图形学学报. 2016(12)
[4]基于运动分割的视频去模糊[J]. 谯从彬,盛斌,吴雯,马利庄.  计算机辅助设计与图形学学报. 2015(11)
[5]显著物体形状结构保持的图像缩放方法[J]. 林晓,沈洋,马利庄,邹盼盼.  计算机科学. 2014(12)



本文编号:3354993

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3354993.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户09d65***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com