基于特征融合与机器学习的RGB-D图像识别技术研究
发布时间:2022-01-09 00:10
与传统的基于二维图像的识别相比,三维的图像识别由于其引入的深度信息,使得其具有更高的准确率和鲁棒性。这是因为三维的RGB-D图像不仅包含了二维图像的颜色、纹理信息,其中的深度图像还包含了目标的表面几何信息。随着Kinect、Xtion等三维体感设备的兴起,RGB-D图像的获取越来越便捷,RGB-D图像的识别技术也越来越成为机器视觉领域的研究热点。另一方面,近年来机器学习在图像识别领域取得了令人瞩目的成绩,特别是卷积神经网络,在大规模数据集的图像识别任务中取得了突破性的进展。基于机器学习算法的RGB-D图像识别成为了机器视觉中的热点问题。针对以往RGB-D图像的特征提取算法存在计算复杂、特征提取不充分以及特征信息冗余等问题,本文提出了一种RGB-D图像的彩色-深度局部Gist特征提取算法。首先将RGB图分解为R、G、B三个通道的图,分别提取三个通道图的局部Gist特征,同时提取深度图的局部Gist特征,通过按行融合的方式组成RGB-D图像的彩色-深度局部Gist特征。对彩色-深度局部Gist特征使用主成分分析法降维后,用K-means++算法聚类构建RGB-D图像的视觉词典,最后基于支持...
【文章来源】:燕山大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
桥梁的点云图
Kinect获取的RGB-D图
GB-D 图像的获取与表示GB-D 图像是由彩色的 RGB 图像与深度图像组合而成,其中 RGB 图像是一种,RGB 表示一种红、绿、蓝三通道的映射空间[30]。三个颜色通道的定的函数关系,叠加组合可以产生丰富的色彩显示。RGB 图像中包含丰理、边缘、色彩等信息,目前基于 RGB 图像的识别算法也取得了很高的,但是由于 RGB 图像的获取方式限制,导致其成像时受光照明暗、颜色很大,在不同环境下对同一物体获取的 RGB 图像差别可能很大,这就导GB 图像的识别算法鲁棒性不高,抗干扰能力弱。GB-D 图像的另一组成对象是深度图,深度图像的存储形式是二维图像,点的值是图像中每点到深度传感器的实际距离的映射。深度图不包含物息,而是包含着物体表面的几何信息与物体在场景的位置信息,通过深很快地将几何结构较复杂的物体区分开来,深度图像是一种与彩色图像。如下图 2-1 是某茶杯的 RGB-D 图中彩色图与深度图。
【参考文献】:
期刊论文
[1]基于深度图像与三维栅格离线映射的机械臂环境建模方法[J]. 李英立,赵忆文,王争,张道辉,赵新刚. 控制与决策. 2020(07)
[2]机器学习中的PCA降维方法研究及其应用[J]. 孙平安,王备战. 湖南工业大学学报. 2019(01)
[3]基于Kinect传感器的移动机器人环境检测方法[J]. 张博. 电子科技. 2018(07)
[4]基于SVM多分类的车牌相似字符识别方法研究[J]. 方玲玉,龚文友. 计算机与数字工程. 2017(07)
[5]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[6]基于机器视觉的图像目标识别方法综述[J]. 张中良. 科技与创新. 2016(14)
[7]工业4.0让智慧城市成为智能社会的载体[J]. 王喜文. 物联网技术. 2016(07)
[8]基于RGB特征与深度特征融合的物体识别算法[J]. 卢良锋,谢志军,叶宏武. 计算机工程. 2016(05)
[9]基于结构光的三维点云重建方法研究[J]. 孙庆科,何云涛,陈瑞强,江月松. 计算机应用研究. 2016(09)
[10]面向智能交互的图像识别技术综述与展望[J]. 蒋树强,闵巍庆,王树徽. 计算机研究与发展. 2016(01)
本文编号:3577545
【文章来源】:燕山大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
桥梁的点云图
Kinect获取的RGB-D图
GB-D 图像的获取与表示GB-D 图像是由彩色的 RGB 图像与深度图像组合而成,其中 RGB 图像是一种,RGB 表示一种红、绿、蓝三通道的映射空间[30]。三个颜色通道的定的函数关系,叠加组合可以产生丰富的色彩显示。RGB 图像中包含丰理、边缘、色彩等信息,目前基于 RGB 图像的识别算法也取得了很高的,但是由于 RGB 图像的获取方式限制,导致其成像时受光照明暗、颜色很大,在不同环境下对同一物体获取的 RGB 图像差别可能很大,这就导GB 图像的识别算法鲁棒性不高,抗干扰能力弱。GB-D 图像的另一组成对象是深度图,深度图像的存储形式是二维图像,点的值是图像中每点到深度传感器的实际距离的映射。深度图不包含物息,而是包含着物体表面的几何信息与物体在场景的位置信息,通过深很快地将几何结构较复杂的物体区分开来,深度图像是一种与彩色图像。如下图 2-1 是某茶杯的 RGB-D 图中彩色图与深度图。
【参考文献】:
期刊论文
[1]基于深度图像与三维栅格离线映射的机械臂环境建模方法[J]. 李英立,赵忆文,王争,张道辉,赵新刚. 控制与决策. 2020(07)
[2]机器学习中的PCA降维方法研究及其应用[J]. 孙平安,王备战. 湖南工业大学学报. 2019(01)
[3]基于Kinect传感器的移动机器人环境检测方法[J]. 张博. 电子科技. 2018(07)
[4]基于SVM多分类的车牌相似字符识别方法研究[J]. 方玲玉,龚文友. 计算机与数字工程. 2017(07)
[5]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[6]基于机器视觉的图像目标识别方法综述[J]. 张中良. 科技与创新. 2016(14)
[7]工业4.0让智慧城市成为智能社会的载体[J]. 王喜文. 物联网技术. 2016(07)
[8]基于RGB特征与深度特征融合的物体识别算法[J]. 卢良锋,谢志军,叶宏武. 计算机工程. 2016(05)
[9]基于结构光的三维点云重建方法研究[J]. 孙庆科,何云涛,陈瑞强,江月松. 计算机应用研究. 2016(09)
[10]面向智能交互的图像识别技术综述与展望[J]. 蒋树强,闵巍庆,王树徽. 计算机研究与发展. 2016(01)
本文编号:3577545
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3577545.html
最近更新
教材专著