基于特征学习的RGB-D目标识别算法研究
本文选题:目标识别 + 深度学习 ; 参考:《华中科技大学》2016年硕士论文
【摘要】:近几年随着传感器技术的发展(微软的Kinect,Intel RealSense 3D等),彩色和深度图像(RGB-D)可以同时获得。那么目标的深度数据的引入的确可以得到额外具有描述能力的信息。那么相对于传统的基于RGB的目标识别范例,如何更好的使用RGB-D的信息来进行目标识别。直观的来说,二维RGB图像并不能获取目标的三维几何特性,而深度信息的引入就带来了克服这个问题的潜力。因此,研究有效的、较强表达能力的RGB-D目标识别算法具有重要的理论意义和实用价值。为了有效的利用深度图像的三维几何信息并结合彩色二维结构信息,即从RGBD图像中获取具有较强表达能力的特征,本文旨在研究性能优异的RGB-D目标识别算法。为此,本文提出了两种基于特征学习RGB-D目标识别算法并取得了比较良好的实验效果。论文的主要内容如下:首先,针对标准的多模态输入的RGB-D目标识别任务,本文提出了一种基于深层卷积神经网络与特征编码的混合结构的RGB-D目标识别算法。利用深层卷积神经网络对于彩色模态的数据利用深层卷积神经网络提取高级的特征表达。对于深度图像利用改进的HONV特征描述子作为底层特征描述并进行Fisher Vector编码以增强特征描述。总体的特征由各个模态的特征级联得到并利用线性支撑向量机作为分类器,在通用RGB-D物体数据集上取得了最优的识别性能。其次,本文研究以无监督的方式为RGB-D图像提取表达能力强的特征,提出了基于多视角无监督学习的RGB-D目标识别算法。对于给定的一帧RGB-D图像数据,利用多视角数据表达将其转换为不用“视角”的数据形式。对于每个视角的数据送入我们提出的无监督特征学习算法(卷积匹配跟踪)进行特征提取。在公共数据集上实验结果表明本文算法中采用的每个视角数据之间的互补特性以及提出的算法的有效性。
[Abstract]:In recent years, with the development of sensor technology (Microsoft's Kinect, Intel RealSense 3D, etc.), color and depth images (RGB-D) can be obtained at the same time. Then the introduction of the target depth data can indeed obtain additional descriptive information. Then, compared to the traditional target recognition paradigm based on RGB, how to better use RGB-D Information is used for target recognition. The two-dimensional RGB image can not obtain the three-dimensional geometric characteristics of the target, and the introduction of the depth information brings the potential to overcome this problem. Therefore, the study of the effective and strong expressive RGB-D target recognition algorithm has important theoretical significance and practical value. The three-dimensional geometric information of the deep image and the color two-dimensional structure information, that is, obtain the strong expressive features from the RGBD image. This paper aims to study the RGB-D target recognition algorithm with excellent performance. In this paper, two target recognition algorithms based on feature learning based on RGB-D are proposed and good experimental results are obtained. The main contents are as follows: firstly, a RGB-D target recognition algorithm based on the mixed structure of deep convolution neural network and feature coding is proposed for the standard multimodal input RGB-D target recognition task, and the advanced convolution neural network is used to extract advanced special features of the color mode data using the deep convolution neural network. The improved HONV feature descriptor is used as the underlying feature description and Fisher Vector coding to enhance the feature description. The overall feature is cascaded by the characteristics of various modes and is used as a classifier by linear support vector machines, and the optimal recognition performance is obtained on the general RGB-D object data set. At the same time, this paper presents a RGB-D target recognition algorithm based on multi view unsupervised learning in unsupervised RGB-D image extraction. For a given frame of RGB-D image data, it is converted into a data form without "visual angle" by multi view data expression. The data for each view is sent to me. The unsupervised feature learning algorithm (convolution matching tracking) is proposed for feature extraction. The experimental results on the public dataset show the complementary characteristics of each view data used in the algorithm and the effectiveness of the proposed algorithm.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 何峻,卢再奇,付强;假设检验方法在目标识别算法评估中的应用[J];雷达与对抗;2004年02期
2 徐小琴;;多传感器数据融合目标识别算法综述[J];红外与激光工程;2006年S4期
3 林思明;;运动目标识别算法研究[J];西北电讯工程学院学报;1985年04期
4 王旭辉;刘云猛;裴浩东;;基于嵌入式图像处理平台的实时多目标识别算法[J];科学技术与工程;2014年03期
5 朱峰,窦丽华,杨国胜,陈文颉;基于异类传感器的战场运动目标识别算法[J];北京理工大学学报;2002年03期
6 孔刚,张启衡,许俊平;一种复杂背景下运动扩展目标识别算法[J];仪器仪表学报;2005年S1期
7 贾宇平;李亚楠;付耀文;庄钊文;;一种基于灰色定权聚类的决策层融合目标识别算法[J];电子与信息学报;2008年02期
8 熊艳,,张桂林,彭嘉雄;自动目标识别算法性能评价的一种方法[J];自动化学报;1996年02期
9 陈喜;陈浩;;针对潜望镜的舰船目标识别算法的研究[J];微计算机信息;2007年01期
10 杜方键;杨宏晖;;两种半监督多类水下目标识别算法的比较[J];声学技术;2014年01期
相关会议论文 前5条
1 徐小琴;;多传感器数据融合目标识别算法综述[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
2 孔刚;张启衡;许俊平;;一种复杂背景下运动扩展目标识别算法[A];第三届全国信息获取与处理学术会议论文集[C];2005年
3 常青;;分形特征目标识别算法[A];2005年中国智能自动化会议论文集[C];2005年
4 王明芬;李翠华;;基于形状外观的海面目标识别算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 王伟明;;一种使用并行黑板模型仿真系统实现的基于知识的图象目标识别算法[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
相关博士学位论文 前10条
1 张抒;可视目标检测与分割关键技术研究[D];电子科技大学;2015年
2 徐培;基于少量样本的快速目标检测与识别[D];电子科技大学;2014年
3 窦建方;视频图像处理中的关键技术研究[D];上海交通大学;2014年
4 刘明;基于流形学习与稀疏描述的SAR目标识别算法研究[D];西安电子科技大学;2015年
5 李大伟;固定翼无人机地面车辆目标自动检测与跟踪[D];中国科学院国家空间科学中心;2017年
6 喻晓源;基于特征学习的目标检测、跟踪、识别算法研究[D];华中科技大学;2014年
7 于加其;基于激光成像雷达距离像的地面目标识别算法研究[D];北京理工大学;2015年
8 严忠贞;内河在航船舶动态跟踪和航迹融合方法研究[D];武汉理工大学;2013年
9 张兵;光学图像末制导中的点目标检测与识别算法研究[D];国防科学技术大学;2005年
10 汪洋;极化合成孔径雷达图像处理及其应用研究[D];安徽大学;2007年
相关硕士学位论文 前10条
1 韩卫洁;入侵报警系统中振动源的目标识别算法研究[D];长安大学;2015年
2 曾诚宇;基于时序光度信号的目标卫星状态特性估计[D];哈尔滨工业大学;2015年
3 闫晓敏;智能监控视频中的目标检测、识别与跟踪算法研究[D];电子科技大学;2015年
4 黄浩;双波段红外成像目标检测与识别方法研究[D];国防科学技术大学;2013年
5 曹昊然;基于LLE与HMM的飞机序列目标识别算法研究[D];东南大学;2015年
6 季康;基于多分类器融合的多视点飞机目标识别算法研究[D];南昌航空大学;2016年
7 宫世杰;视频监控中基于ICP算法的多目标跟踪技术研究与实现[D];山东大学;2016年
8 周小龙;具有旋转与尺度不变性的多目标识别算法研究与应用[D];暨南大学;2016年
9 姜化冰;探地雷达地下空洞目标探测研究[D];哈尔滨工业大学;2016年
10 丁文静;多传感器信息融合目标识别算法研究[D];江南大学;2016年
本文编号:1826152
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1826152.html