当前位置:主页 > 科技论文 > 自动化论文 >

面向场景理解的细粒度图像分割算法研究

发布时间:2020-06-01 05:37
【摘要】:随着人工智能的蓬勃发展,无人驾驶汽车等一系列新兴产品开始问世,相关应用对图像分析及场景理解的需求也日益增加。图像分割相关研究在各个领域起着重要作用,其分割结果有助于后续的场景理解与分析,相关研究具有重要的研究意义和广泛的应用场景。本文研究的细粒度图像分割算法不仅要为图片中每一实例生成掩模,而且需要区分图片中各实例的细粒度类别信息。这就需要算法在完成细粒度分类的基础上对其进行有效分割,以辅助后续场景理解与分析,例如可以作为场景分析的注意力引入相关端到端模型。相关研究相较于传统图像分割更具挑战性。本文主要工作包括:(1)研究及对比分析了四种基于深度学习的主流分割算法:FCN、SegNet、FCIS和Mask R-CNN。其中FCN首次将全卷积网络结构应用到语义分割任务中,是一个端到端、像素到像素的分割方法;SegNet网络类似于FCN网络,其编码和解码的网络与FCN不同;FCIS采用了物体和背景位置敏感的特征提取方法,物体特征用于分割,背景特征用于分类;Mask R-CNN则在同一网络中同时完成目标检测和实例分割两个任务。复现结果表明,Mask R-CNN网络的图像分割结果较好,因此本文后续的相关研究以其作为骨架网络模型。(2)提出了一种基于特征金字塔注意力(Feature Pyramid Attention,FPA)的图像分割算法。由第二章的研究分析可知,目前的分割方法对像素位置信息的学习能力不足。本文所提算法通过金字塔结构使网络将注意力集中于Mask,直接对Mask学习,而非对特征图进行学习,最大程度地保留像素级的位置信息,从而充分利用学习到的上下文信息,提高生成Mask的质量。实验结果表明,本文所提基于特征金字塔注意力机制的算法对于图像中小尺度目标的分割结果较好。(3)提出了一种基于全局特征金字塔注意力(Global Feature Pyramid Attention,GFPA)的细粒度图像分割算法。传统图像分割算法只能对粗粒度实例类别加以区分并生成Mask,而对于同一大类的细粒度类别信息不能加以区分。为了实现细粒度图像分割,我们改进了第三章所提的FPA注意力模型,通过在FPA模型中增加全局池化模块,构建了全局特征金字塔注意力。基于偏监督学习训练模式,我们采用Open Images V4数据集对所提网络的分类分支单独训练,以得到细粒度的类别信息。而Open Images V4数据集只对物体的类别和边界框进行了标注,所以在训练Mask分支时我们仍采用COCO数据集对网络进行训练,最后通过两路网络的协同和知识迁移,实现细粒度的像素级分割。实验结果表明,与Mask R-CNN相比,本文所提算法可在实现细粒度分类的同时对其进行像素级分割。
【图文】:

网络结构图,全卷


是将深层的、抽象的语义信息和浅层的、细致的图像信息结合起来,最终实现网络逡逑能够生成针对图像的更精准的语义分割信息。逡逑网络实现的是一个端到端、像素到像素的方法去解决语义分割问题。图2-1所逡逑示的是网络结构图。从图中我们可以看出网络将低层细致的信息和高层抽象的信逡逑息结合起来。池化层和预测层显示的网格密度是由相对空间网格的粗细决定的。图逡逑中竖线表示的是中间层。图中第一行FCN-32S表示上采样步骤是一步到位的,将逡逑7逡逑

网络结构图,编码网络,卷积,解码网络


卷积网络具有平移不变性网络由卷积层、池化层和激活函数等组成,这些逡逑运算只关联着图像中空间坐标中的像素点。设在某层中某个像素点可表示为(i,乃逡逑则该位置的向量可表示为;经过一系列运算,如卷积、池化等,得到向量yf逡逑Yij邋=邋fks({^si+Si,sj+Sj]邋0邋Sif邋8j邋<邋k)逦(2-1)逡逑其中,k表示卷积核的大小,s表示步长,八5代表不同层中不同运算法则。FCN网逡逑络中的损失函数是每行中最后一层的每个像素的softmax分类损失之和。逡逑2.2邋SegNet图像分割算法逡逑SegNet图像分割算法在整体结构上与FCN网络非常近似。它运用了两个网络逡逑结构:编码网络和解码网络。其中编码网络相当于FCN中的卷积,,解码网络相当逡逑于FCN网络中的上采样。SegNet中的编码网络结构都有一个反向对应的解码网络,逡逑解码器的最后一层连接一个softmax的分类器,目的是对每一个像素预测它的类概逡逑率。其网络结构如图2-2所示。逡逑— ̄^— ̄逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP18

【相似文献】

相关期刊论文 前10条

1 王盼我;;基于熵的图像分割算法研究[J];科技视界;2018年08期

2 王华翔;丁家纪;王旭;;基于信息论的图像分割算法研究[J];黑龙江科技信息;2015年25期

3 李娟;康戈文;;一种基于方向的图像分割算法[J];可编程控制器与工厂自动化;2012年02期

4 张春伶;;图像分割算法综述与探索[J];科技创新与应用;2012年13期

5 周强;;图像分割算法研究[J];福建电脑;2009年06期

6 吉李满;;图像分割算法的应用与评价[J];吉林工程技术师范学院学报;2006年09期

7 周维真;周滨;;一种改进的塔形结构图像分割算法[J];西安电子科技大学学报;1988年03期

8 胡雅婷;李长明;柳振鑫;任虹宾;陈营华;;一种鲁棒的无监督聚类图像分割算法[J];吉林大学学报(理学版);2019年06期

9 李竹林;王静;;一种基于滤波的分段点乘图像分割算法[J];电子设计工程;2016年23期

10 李锋林;李亮;;基于显著性检测的目标图像分割算法[J];电子科技;2017年01期

相关会议论文 前10条

1 张峰;申功勋;;一种适用于天文导航的快速图像分割算法[A];中国航空学会控制与应用第十二届学术年会论文集[C];2006年

2 赵海英;杨一帆;徐光美;;基于边缘形态变换的彩色织物图像分割算法[A];第十五届全国图象图形学学术会议论文集[C];2010年

3 胡阳涟;赵凤群;戴芳;张辉;;一种基于马尔可夫随机场的快速图像分割算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

4 陈亮;叶旭鸣;俞利;;一种基于图论的图像分割算法[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年

5 刘晓龙;张佑生;;基于模拟退火的模糊C-均值聚类图像分割算法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

6 李景福;龙志军;张报山;包晨阳;;一种改进的红外图像分割算法[A];2007年中国农业工程学会学术年会论文摘要集[C];2007年

7 万永菁;杨大毛;;一种图像分割算法在纤维增强复合材料图像处理中的应用(英文)[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

8 杨卫平;李忠科;王勇;吕培军;;基于区域的图像分割算法综述[A];第十七届全国测控计量仪器仪表学术年会(MCMI'2007)论文集(上册)[C];2007年

9 傅明建;刘秉瀚;;一种肾小管病理图像分割算法[A];第十四届全国图象图形学学术会议论文集[C];2008年

10 沙莎;彭丽;罗三定;;一种基于边缘检测的阈值图像分割算法[A];中国计算机图形学进展2008--第七届中国计算机图形学大会论文集[C];2008年

相关重要报纸文章 前1条

1 王小龙;美开发出基于热映像的图像分割算法[N];科技日报;2011年

相关博士学位论文 前10条

1 刘仲民;基于图论的图像分割算法的研究[D];兰州理工大学;2018年

2 宋艳涛;基于磁共振成像的脑组织及病变分割方法研究[D];南京理工大学;2017年

3 毕卉;HIFU超声图像分割算法研究[D];东南大学;2018年

4 颜刚;基于模糊马尔可夫场的图像分割算法研究[D];第一军医大学;2005年

5 李彬;基于模糊随机模型的磁共振脑部图像分割算法研究[D];第一军医大学;2007年

6 刘毅;基于图割的交互式图像分割算法研究[D];南京理工大学;2013年

7 许晓丽;基于聚类分析的图像分割算法研究[D];哈尔滨工程大学;2012年

8 车娜;基于偏移场的核磁共振脑图像分割算法研究[D];吉林大学;2013年

9 陈圣国;图像分割及应用技术研究[D];南京大学;2012年

10 皮志明;结合深度信息的图像分割算法研究[D];中国科学技术大学;2013年

相关硕士学位论文 前10条

1 刘霞;基于深度学习的手指静脉特征提取与防伪检测算法研究[D];重庆工商大学;2019年

2 郑楚雄;基于深度学习的血管图像分割算法研究[D];广州大学;2019年

3 廖敏;面向安防机器人的障碍物图像分割算法应用研究[D];电子科技大学;2019年

4 赵颖超;基于FCM的图像分割算法研究[D];湖南师范大学;2019年

5 刘洋;基于空间约束的FCM图像分割算法研究[D];吉林大学;2019年

6 吴垒;基于空间颜色密度分布估计的轮廓检测和图像分割算法研究[D];吉林大学;2019年

7 丁新辉;特定医学图像分割算法研究及可视化系统的设计与实现[D];河南大学;2019年

8 安郝敏;基于图像分割算法的标注系统的设计与实现[D];北京交通大学;2019年

9 段瑶;基于FCM的彩色图像分割算法研究[D];重庆邮电大学;2018年

10 张相怡;面向场景理解的细粒度图像分割算法研究[D];北京交通大学;2019年



本文编号:2691020

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2691020.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户94f68***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com