基于深度学习的图像分割研究
本文选题:图像分割 切入点:深度学习 出处:《吉林大学》2017年硕士论文
【摘要】:图像分割是数字图像处理领域的一个主要研究方向,在许多计算机视觉应用的研究中作为第一步,起到十分关键的作用。由于图像分割的重要性和困难性,图像分割技术自20世纪70年代以来一直备受研究人员的重视。虽然人们针对各种问题提出了许多方法,但到目前为止仍然没有一个适用于大多数图像的分割算法,也没有制定出标准来选择适用的分割算法。传统的图像分割方法大部分先对图像进行特征提取,然后映射到某种模型中,不仅过程复杂,效果不鲁棒,且往往不能给出语义信息。因此,提高图像分割算法的效率并且提升分割效果具有重要的意义。得益于“大数据”和高性能计算设备的发展,深度学习成为当前人工智能领域的一大研究热点。深度学习本质上是神经网络的拓展,目前在语音识别、人脸识别、物体识别、目标检测等诸多人工智能领域都取得了突破性进展。在计算机视觉领域,深度学习应用最广泛的一种模型就是卷积神经网络。其通过局部连接和权值共享两个特性,大大减少了模型参数的数量,从而使模型可以做到很深的层次。深度学习可以从大量标注图像数据直接学习和提取相关特征,省略过去十分繁杂的建模过程,为许多领域的研究提供了便利。本文就是针对基于深度学习的图像分割方法进行深入研究。基于深度学习的图像语义分割的主要思路是,使用像素级标注的图像,利用上采样、反卷积等特殊层,将普通卷积网络提取到的特征再还原回原图像尺寸,从而实现一种端到端的学习。本文在借鉴已有网络的基础上,提出了一种叫Fast-Seg Net的网络新架构,新架构使用了最新的残差网络结构,结合了稀疏卷积、分解卷积等操作,配合批归一化,将网络深度做到了28层,在提高了精度的同时,依然保持了运行的速度。通过迁移学习的训练方法,加快了网络的收敛速度和精度。另外,本文提出了一套对图像进行像素级标注的工具和流程,并编写了图像像素级标注检查工具,采集了吉林大学校园里的街景,合格标注了1566张照片,并在其上面训练了Fast-Seg Net,取得了不错的效果,平均联合交叉度量m Io U达到了70.2%。
[Abstract]:Image segmentation is one of the main research directions in the field of digital image processing. As the first step in many computer vision applications, image segmentation plays a very important role.Because of the importance and difficulty of image segmentation, image segmentation technology has been paid much attention by researchers since 1970s.Although many methods have been proposed to solve various problems, up to now, there is still not a segmentation algorithm suitable for most images, nor has a standard been developed to select suitable segmentation algorithms.Most of the traditional image segmentation methods firstly extract the features of the image and then map to a certain model. The process is not only complex the effect is not robust but also the semantic information is often not given.Therefore, it is of great significance to improve the efficiency of image segmentation algorithm and improve the segmentation effect.With the development of big data and high performance computing equipment, deep learning has become a hot topic in the field of artificial intelligence.Depth learning is essentially an extension of neural network. At present, many artificial intelligence fields such as speech recognition, face recognition, object recognition, target detection and so on have made breakthrough progress.In the field of computer vision, one of the most widely used models of deep learning is convolution neural network.By means of local connection and weight sharing, the number of model parameters is greatly reduced, thus the model can achieve a very deep level.Depth learning can directly learn and extract relevant features from a large number of annotated image data, omitting the complicated modeling process of the past, and providing convenience for the research in many fields.In this paper, the method of image segmentation based on depth learning is studied in depth.The main idea of image semantic segmentation based on depth learning is to use the image tagged at pixel level, using special layers such as upper sampling, deconvolution and so on, to restore the features extracted from the general convolution network back to the original image size.In order to achieve an end-to-end learning.Based on the existing network, a new network architecture called Fast-Seg Net is proposed in this paper. The new architecture uses the latest residual network structure, combines the operations of sparse convolution, decomposition convolution and batch normalization.The network depth is 28 layers, which improves the accuracy and still keeps the speed of operation.The convergence speed and accuracy of the network are accelerated by the training method of transfer learning.In addition, this paper puts forward a set of tools and flow chart for image pixel level labeling, and compiles the image pixel level label inspection tool, collects the street view of Jilin University campus, and marks 1566 photos qualified.The Fast-Seg net is trained on it, and good results are obtained, and the average joint cross metric Mio U reaches 70.2%.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 李仲;图像分割的妙法[J];电脑知识与技术;2000年S2期
2 唐伟力;龙建忠;;一种基于降雨模型的图像分割方法在砾岩图像分割中的应用[J];成都信息工程学院学报;2007年02期
3 黄晓莉;曾黄麟;王秀碧;刘永春;;基于脉冲耦合神经网络的图像分割[J];信息技术;2008年09期
4 肖飞;綦星光;;图像分割方法综述[J];可编程控制器与工厂自动化;2009年11期
5 汪一休;;一种交互式图像分割的修正优化方法[J];中国科学技术大学学报;2010年02期
6 李丹;;图像分割方法及其应用研究[J];科技信息;2010年36期
7 龚永义;黄辉;于继明;关履泰;;基于熵的两区域图像分割[J];中国图象图形学报;2011年05期
8 张甫;李兴来;陈佳君;;浅谈图像分割方法的研究运用[J];科技创新与应用;2012年04期
9 汪梅;何高明;贺杰;;常见图像分割的技术分析与比较[J];计算机光盘软件与应用;2013年06期
10 魏庆;卢照敢;邵超;;基于复杂性指数的图像分割必要性判别技术[J];计算机工程与应用;2013年16期
相关会议论文 前10条
1 杨魁;赵志刚;;图像分割技术综述[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
2 杨暄;郭成安;李建华;;改进的脉冲耦合神经网络及其在图像分割中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 杨生友;;图像分割在医学图像中应用现状综述[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
4 闫平昆;;基于模型的图像分割技术及其医学应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 高岚;胡友为;潘峰;卢凌;;基于小生境遗传算法的SAR图像分割[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(下册)[C];2005年
6 孙莉;张艳宁;胡伏原;赵荣椿;;基于Gaussian-Hermite矩的SAR图像分割[A];第十三届全国图象图形学学术会议论文集[C];2006年
7 李盛;;基于协同聚类的图像分割[A];第十四届全国图象图形学学术会议论文集[C];2008年
8 张利;许家佗;;舌象图像分割技术的研究与应用进展[A];中华中医药学会中医诊断学分会第十次学术研讨会论文集[C];2009年
9 秦昆;李振宇;李辉;李德毅;;基于云模型和格网划分的图像分割方法[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
10 高惠琳;窦丽华;陈文颉;谢刚;;图像分割技术在医学CT中的应用[A];中国自动化学会控制理论专业委员会A卷[C];2011年
相关博士学位论文 前10条
1 白雪飞;基于视觉显著性的图像分割方法研究[D];山西大学;2014年
2 黄万里;基于高分卫星数据多尺度图像分割方法的天山森林小班边界提取研究[D];福建师范大学;2015年
3 王辉;图像分割的最优化和水平集方法研究[D];电子科技大学;2014年
4 高婧婧;脑部MR图像分割理论研究[D];电子科技大学;2014年
5 潘改;偏微分方程在图像分割中的应用研究[D];东北大学;2013年
6 冯籍澜;高分辨率SAR图像分割与分类方法研究[D];电子科技大学;2015年
7 李伟斌;图像分割中的变分模型与快速算法研究[D];国防科学技术大学;2014年
8 邓晓政;基于免疫克隆选择优化和谱聚类的复杂图像分割[D];西安电子科技大学;2014年
9 帅永e,
本文编号:1710972
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1710972.html