物体分割与识别方法的研究和实现
本文选题:物体分割 切入点:物体识别 出处:《南京大学》2017年硕士论文
【摘要】:静态图片中物体的分割和识别是计算机视觉任务中两个非常重要的话题,二者之间紧密联系,彼此可以相互利用。然而对静态图片进行像素级的分割是一件很有难度的任务,这是因为现实中拍摄的照片往往受到光照和噪声的影响,除此以外,图片的背景有时也会很复杂,可能会和要分割的物体在颜色和纹理上相似。另一方面,对于静态图片的物体识别,目前很多方法都是基于滑动窗口+物体特征+分类器这种组合,该方法主要的缺点在于需要不断通过滑动窗口来扫描整张图片,然后对每一个窗口进行分类,所以会导致速度很慢。为了解决这些问题,我们先后设计了几种能够对静态图片中物体进行分割和识别的解决方案并进行了实验和对比分析。我们首先提出一个交互的分割方法,该方法基于Adaboost的分类思想,把超像素作为被处理的单元进行分类,而不再是单个像素,用户只需要提供少量的样本种子点即可。在该方法的基础上,我们结合了人体的姿势信息,从而可以对静态图片中的人体进行自动化分割,它可以对图片中人体的任意姿势进行分割,相较于一些需要通过人脸来定位人体位置再进行人体分割的方法,我们的方法不仅可以处理人体正面,也可以处理侧面和背面。此外,我们还利用卷积神经网络来进行物体分割,该框架由两个神经网络组成,其中定位网络负责定位图片中物体的位置,分割网络则负责对图片进行分割。对于以上得到的分割结果,往往会比较粗糙,我们使用了两种方法来进行优化,分别是高斯背景建模和bayse matting,其中我们对bayse matting算法进行了改进。对于物体识别任务,我们借鉴了基于区域的物体识别方法,即利用图割先对图片分割成多个区域,然后不断合并相似的区域,最后对得到的每一个区域进行分类。对于单个区域内的物体分类,我们分别使用HOG和CNN两种方式进行特征提取,再用SVM来进行训练,后者达到了更好的效果。但CNN提取特征的方式需要对每个区域进行一次卷积过程,所以很耗费时间,因此我们又参考了 FastRCNN的方法,在卷积层后面加入一个池化层,从而只需对整张图片进行一次卷积过程,该方法大大缩短了运行时间。最后我们在多个广泛使用的数据集上完成了物体分割和识别的多项实验,我们的方法在准确率和性能上都取得了不错的效果。
[Abstract]:The segmentation and recognition of objects in static images are two very important topics in the task of computer vision. They are closely related and can be used each other.However, it is a difficult task to segment static images at the pixel level, because the pictures taken in reality are often affected by illumination and noise. Besides, the background of the images is sometimes very complex.May be similar to the object to be segmented in color and texture.On the other hand, for the object recognition of static images, many methods are based on the combination of sliding window object feature classifier. The main disadvantage of this method is the need to scan the whole picture through sliding window.Each window is then sorted, so the speed is slow.In order to solve these problems, we have designed several solutions for segmentation and recognition of objects in static images, and carried out experiments and comparative analysis.We first propose an interactive segmentation method, which is based on the idea of Adaboost, and classifies super-pixels as processed units instead of single pixels. Users only need to provide a small number of sample seed points.On the basis of this method, we combine the posture information of human body, so we can automatically segment the human body in the static picture, and it can segment any pose of the human body in the picture.Compared with some methods which need to locate the position of human body by human face, our method can not only deal with the front of the human body, but also deal with the side and back.In addition, we use convolution neural network to segment objects. The framework consists of two neural networks, in which the location network is responsible for locating the position of the object in the picture, and the segmentation network is responsible for the image segmentation.For the above segmentation results, often rough, we use two methods to optimize, namely Gao Si background modeling and bayse matting, in which we improve the bayse matting algorithm.For the object recognition task, we draw lessons from the area-based object recognition method, that is, the image is divided into several regions by graph cutting, and then the similar regions are continuously merged, and finally each region is classified.For the classification of objects in a single region, we use HOG and CNN for feature extraction, and then use SVM for training, the latter achieves better results.But the way CNN extracts features requires a convolution process for each region, so it's time-consuming, so we refer to the FastRCNN method and add a pool layer after the convolution layer.Thus, only one convolution process is needed for the whole picture, and the running time is greatly reduced.Finally, we have completed many experiments of object segmentation and recognition on a number of widely used datasets, and our method has achieved good results in accuracy and performance.
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 代松;李伟生;;基于亲和传递聚类的多类物体识别方法[J];计算机工程;2009年14期
2 邹利华;;三种基于特征的物体识别算法对比与分析[J];软件导刊;2010年05期
3 连灵;游旭群;;三维物体识别的心理表征:角度依赖还是角度独立[J];心理学报;2011年09期
4 王喜顺;刘曦;史忠植;隋红建;;一种基于特征整合理论的物体识别模型(英文)[J];中国科学院研究生院学报;2012年03期
5 胡敏;齐梅;王晓华;许良凤;;基于显著区域词袋模型的物体识别方法[J];电子测量与仪器学报;2013年07期
6 余少波;鞠发平;肖英明;;物体识别不变性方法比较分析(Ⅱ)——解析方法[J];海军工程学院学报;1993年01期
7 曾建超,柳慧群,林学;基于规则的物体识别定位方法[J];高技术通讯;1995年04期
8 李育贤,王洪波,赵莉;二维物体识别的暂态混沌神经网络方法[J];陕西师范大学学报(自然科学版);2000年01期
9 邵洁;董楠;;基于相关向量机的物体识别[J];上海电力学院学报;2011年02期
10 杨雄;彭刚;徐涛;刘利;兰远东;;物体识别的精神物理学实验测试[J];惠州学院学报(自然科学版);2012年03期
相关会议论文 前10条
1 陈柘;赵荣椿;;几何不变性及其在3D物体识别中的应用[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
2 连灵;张敏;;三维物体识别的心理表征:角度依赖还是角度独立[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年
3 周程;吴飞;庄越挺;;基于层次反馈机制的物体识别[A];第十五届全国图象图形学学术会议论文集[C];2010年
4 孙彦良;任衍具;;真实场景中朝向和背景对物体识别的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年
5 郭明玮;朱明清;赵宇宙;王建;陈宗海;;基于生物视觉的物体识别方法研究现状分析[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
6 艾浩军;朱荣;张敏;李俊;方禹;王红霞;;基于SIFT尺度分量的两级匹配物体识别算法研究[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 熊英;马惠敏;;SIFT特征在三维物体识别中的应用[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
8 鲁迪;姜志国;;基于图元检测的物体识别方法研究[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
9 杜建洪;梁子长;;车辆走向定位技术的研究[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
10 宋广青;高莉;孙秀萍;刘新民;;物体识别实验在东莨菪碱致大鼠学习记忆障碍中的应用[A];2013年全国老年性痴呆与相关疾病学术会议论文汇编[C];2013年
相关博士学位论文 前10条
1 陆王天宇;受生物启发的物体识别算法研究[D];复旦大学;2013年
2 王静;视网膜假体中人工视觉信息处理及优化表达研究[D];上海交通大学;2014年
3 齐勇刚;基于草图和边缘的物体识别[D];北京邮电大学;2015年
4 黄颖;基于图理论的图像处理与物体识别算法的研究[D];电子科技大学;2012年
5 刘光灿;基于机器学习的物体识别[D];上海交通大学;2013年
6 徐胜;三维物体识别研究[D];电子科技大学;2010年
7 王兴刚;物体识别中的形状建模和弱监督学习[D];华中科技大学;2014年
8 王利明;机器视觉中物体识别方法的研究与探讨[D];复旦大学;2009年
9 彭绍武;基于形状与语义建模的物体识别[D];华中科技大学;2009年
10 陶维东;非面孔物体识别倒置效应[D];西南大学;2009年
相关硕士学位论文 前10条
1 周淼;物体识别中与特征整合相关的脑电活动研究[D];电子科技大学;2012年
2 刘杰;小型地面移动机器人视觉图像特征提取[D];新疆大学;2015年
3 王沁波;基于分层结构的多物体图像识别系统的设计与实现[D];电子科技大学;2014年
4 李元辉;换垫料应激损害大鼠新颖物体识别记忆再激活后提取及其胆碱能受体机制[D];南华大学;2015年
5 李额;Apelin-13改善强迫游泳应激诱导大鼠新颖物体识别记忆损伤[D];南华大学;2015年
6 刘苗苗;基于2D和3D SIFT特征融合的一般物体识别算法研究[D];东南大学;2015年
7 程玉立;面向工业应用的机器人手眼标定与物体定位[D];浙江大学;2016年
8 周楠钊;基于SIFT特征的物体识别系统的设计与实现[D];兰州大学;2016年
9 陈佳洲;室内场景物体同时识别与建模[D];广东工业大学;2016年
10 廉彬;长期母婴分离对大鼠成年后新异性物体识别和社会性识别的影响[D];西南大学;2016年
,本文编号:1724998
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1724998.html