基于多模态深度学习的RGB-D物体识别
本文选题:多模态 + 稀疏自编码 ; 参考:《计算机工程与设计》2017年06期
【摘要】:针对现有RGB-D物体识别方法存在图像特征学习不全面、类间相似的物体识别精度不高等问题,联合稀疏自编码(sparse auto-encoder,SAE)及递归神经网络(recursive neural networks,RNNs)提出多模态稀疏自编码递归神经网络(multi-modal sparse auto-encoder and recursive neural networks,MSAE-RNNs)的深度学习模型。SAE结合卷积及池化技术分别从RGB-D图像的RGB图、灰度图、深度图、3D曲面法线中提取低层次的平移不变性特征,作为多个固定树RNNs的输入,得到更加抽象的高层特征,融合后的多模态特征,采用SVM分类器进行分类。在RGB-D数据集上的实验结果表明,该算法的物体识别率达到90.7%,较其它算法提高了3%-9%,能很好完成RGB-D物体的识别。
[Abstract]:In view of the existing RGB-D object recognition methods, the image feature learning is not comprehensive, and the recognition accuracy of objects similar to each other is not high. Combined sparse self-coding Sparse auto-encodern (SAE) and recursive neural network recursive neural networks (RNNs), a multi-modal sparse self-coding recursive neural network multi-modal sparse auto-encoder and recursive neural networks-MSAE-RNNs is proposed. SAE combines convolution and pool techniques from RGB images, grayscale images, gray images of RGB-D images, etc. The translation invariance feature of low level is extracted from 3D surface normals of depth map, which is used as input of multiple fixed tree RNNs to obtain more abstract high-level features and multimodal features after fusion. SVM classifier is used for classification. The experimental results on the RGB-D dataset show that the recognition rate of the proposed algorithm is 90.7, which is 3- 9 higher than that of other algorithms, and the recognition of RGB-D objects can be accomplished well.
【作者单位】: 武汉科技大学计算机科学与技术学院;武汉科技大学湖北省智能信息处理与实时工业系统重点实验室;
【基金】:国家自然科学基金面上基金项目(41571396) 国家创新训练基金项目(201410488017) 省级大学生创新创业训练计划基金项目(201410488038) 校级大学生科技创新基金项目(14ZRA079、14ZRC093)
【分类号】:TP183;TP391.41
【相似文献】
相关期刊论文 前10条
1 代松;李伟生;;基于亲和传递聚类的多类物体识别方法[J];计算机工程;2009年14期
2 邹利华;;三种基于特征的物体识别算法对比与分析[J];软件导刊;2010年05期
3 连灵;游旭群;;三维物体识别的心理表征:角度依赖还是角度独立[J];心理学报;2011年09期
4 王喜顺;刘曦;史忠植;隋红建;;一种基于特征整合理论的物体识别模型(英文)[J];中国科学院研究生院学报;2012年03期
5 胡敏;齐梅;王晓华;许良凤;;基于显著区域词袋模型的物体识别方法[J];电子测量与仪器学报;2013年07期
6 余少波;鞠发平;肖英明;;物体识别不变性方法比较分析(Ⅱ)——解析方法[J];海军工程学院学报;1993年01期
7 李育贤,王洪波,赵莉;二维物体识别的暂态混沌神经网络方法[J];陕西师范大学学报(自然科学版);2000年01期
8 邵洁;董楠;;基于相关向量机的物体识别[J];上海电力学院学报;2011年02期
9 杨雄;彭刚;徐涛;刘利;兰远东;;物体识别的精神物理学实验测试[J];惠州学院学报(自然科学版);2012年03期
10 徐晓;;计算机视觉中物体识别综述[J];电脑与信息技术;2013年05期
相关会议论文 前9条
1 陈柘;赵荣椿;;几何不变性及其在3D物体识别中的应用[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
2 连灵;张敏;;三维物体识别的心理表征:角度依赖还是角度独立[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年
3 周程;吴飞;庄越挺;;基于层次反馈机制的物体识别[A];第十五届全国图象图形学学术会议论文集[C];2010年
4 孙彦良;任衍具;;真实场景中朝向和背景对物体识别的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年
5 郭明玮;朱明清;赵宇宙;王建;陈宗海;;基于生物视觉的物体识别方法研究现状分析[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
6 艾浩军;朱荣;张敏;李俊;方禹;王红霞;;基于SIFT尺度分量的两级匹配物体识别算法研究[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 熊英;马惠敏;;SIFT特征在三维物体识别中的应用[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
8 鲁迪;姜志国;;基于图元检测的物体识别方法研究[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
9 杜建洪;梁子长;;车辆走向定位技术的研究[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
相关博士学位论文 前10条
1 陆王天宇;受生物启发的物体识别算法研究[D];复旦大学;2013年
2 王静;视网膜假体中人工视觉信息处理及优化表达研究[D];上海交通大学;2014年
3 齐勇刚;基于草图和边缘的物体识别[D];北京邮电大学;2015年
4 黄颖;基于图理论的图像处理与物体识别算法的研究[D];电子科技大学;2012年
5 刘光灿;基于机器学习的物体识别[D];上海交通大学;2013年
6 徐胜;三维物体识别研究[D];电子科技大学;2010年
7 王兴刚;物体识别中的形状建模和弱监督学习[D];华中科技大学;2014年
8 王利明;机器视觉中物体识别方法的研究与探讨[D];复旦大学;2009年
9 彭绍武;基于形状与语义建模的物体识别[D];华中科技大学;2009年
10 朱荣;基于计算机视觉的物体分类关键技术研究[D];武汉大学;2011年
相关硕士学位论文 前10条
1 周淼;物体识别中与特征整合相关的脑电活动研究[D];电子科技大学;2012年
2 刘杰;小型地面移动机器人视觉图像特征提取[D];新疆大学;2015年
3 王沁波;基于分层结构的多物体图像识别系统的设计与实现[D];电子科技大学;2014年
4 刘苗苗;基于2D和3D SIFT特征融合的一般物体识别算法研究[D];东南大学;2015年
5 程玉立;面向工业应用的机器人手眼标定与物体定位[D];浙江大学;2016年
6 周楠钊;基于SIFT特征的物体识别系统的设计与实现[D];兰州大学;2016年
7 胡耀;自然场景中物体识别算法研究[D];华南理工大学;2016年
8 蒋哲翎;基于NAO机器人的物体识别与定位技术研究[D];南京大学;2016年
9 孙俊;基于卷积神经网络的电商图片物体识别[D];电子科技大学;2016年
10 杨眷玉;基于卷积神经网络的物体识别研究与实现[D];电子科技大学;2016年
,本文编号:1868901
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1868901.html