基于深度学习的点云分类研究
发布时间:2021-12-23 09:27
随着三维数据采集设备的推广应用,三维数据的获取更加便捷。三维数据包含丰富的几何、形状和比例信息。如何有效准确地对三维数据分类、分割、识别,是目前计算机视觉领域的研究热点。本文着重分析了基于不同三维模型表示格式的深度学习网络模型的工作原理,分析了网络结构中特征提取方法的优缺点。针对现有深度学习网络模型存在的训练过程繁杂、缺乏有效的局部信息提取手段等问题,根据三维数据非结构化的特点,提出了基于图卷积神经网络的点云模型分类网络。本文的工作与成果为:(1)提出了两种构建图卷积计算所需的邻接矩阵的方法,分别是基于K近邻构建邻接矩阵的方法与利用网格信息构建邻接矩阵的方法。基于K近邻构建邻接矩阵方法的思路为:针对点云中的某个顶点,采用k近邻构建该顶点的邻接关系;对所有顶点应用该方法得到所有顶点的邻接关系,并以此构建邻接矩阵;基于网格信息构建邻接矩阵方法的思路为:首先构建一个n*n(n为顶点数量)零矩阵,然后通过遍历网格数据中的面片,通过面片中的顶点索引建立邻接关系,对于存在邻接关系的顶点,在零矩阵中将对应权值置为1,最终构建出邻接矩阵。(2)为图卷积提取的三维数据特征信息设计了分类网络模型。首先将邻...
【文章来源】:中北大学山西省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
感知机模型
中北大学学位论文8感知机是一个线性的二分类器,但不能对非线性数据有效的分类。而多层感知机通过添加激活函数,如线性整流函数(RectifiedLinearUnit,ReLU)、径向基函数(RadicalBasisFunction,RBF)、Sigmoid函数、双曲正切(tanh)函数等引入非线性因素,其理论上可以拟合任意复杂的函数,使得其可以处理感知机无法解决的线性不可分问题。多层感知机除去输入层(InputLayer)和输出层(OutputLayer)外,至少包括一个隐藏层(HiddenLayer),隐藏层由全连接层组成,见图2-2。图2-2多层感知机结构图Fig2-2Multilayerperceptronstructure2.1.2卷积神经网络真正意义上的卷积神经网络(ConvolutionalNeuralNetworks,CNN)是由YannLeCun于1989年提出的LeNet[25]。并于1998年在YannLeCun的博士论文中详细阐述了LeNet-5的原理[26],并应用于手写数字识别。但受限于当时的计算机硬件发展水平,没有足够规模的数据无法进行深度迭代的训练。2006年,Hinton提出的深度置信网络(DeepBeliefNetwork,DBN)[27],使得可以通过额外的预训练解决传统多层感知机或者神经网络中陷入局部最小值的问题。直到2012年,KrizhevskyA,SutskeverI,HintonGE等人在ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)图像分类任务中提出
中北大学学位论文9AlexNet[28]并取得冠军。随后提出的GoogLeNet[29]、VGG[30]也分别在ILSVRC竞赛中得了冠军和亚军的优秀成绩,至此深度学习在计算机视觉领域正式迎来了高速发展的时机。卷积神经网络的基本结构包含输入层(Inputlayer)、卷积层(Convolutional)、池化层(Poolinglayer)、全连接层(FullyConnectedLayer)及输出层五个部分,卷积层和池化层一般会交替设置。卷积神经网络的结构见图2.3,卷积神经网络具有如下特点:(1)权重共享:同一个卷积核可以滑动在不同位置进行卷积操作。(2)局部性:仅和层与层之间的部分节点有对应关系。(3)多尺度:通过级联卷积神经网络,可以将图像数据不断采样以减小数据量,从而可以获得更大的感受野(ReceptiveField)。图2-3VGG16模型[30]Fig2-3VGG16modelCNN中常见的卷积核类型有一维卷积核,主要用于只有一个维度的时间序列提取图2-4一维卷积Fig2-41DCNN特征,一维数据输入可以具有多个通道。但卷积核只能沿一个方向移动。单通道1D卷
【参考文献】:
期刊论文
[1]基于图卷积的计算机辅助设计模型分类[J]. 李梦吉,韩燮. 科学技术与工程. 2020(13)
[2]一种用于点云分类的轻量级深度神经网络[J]. 闫林,刘凯,段玫妤. 西安电子科技大学学报. 2020(02)
[3]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
博士论文
[1]三角网格模型的分割、评价及其应用研究[D]. 秦茂玲.山东师范大学 2013
硕士论文
[1]三维激光点云数据的处理及应用研究[D]. 孙钰科.上海师范大学 2018
[2]基于激光雷达的车前地形快速测量方法关键技术研究[D]. 孙政扬.吉林大学 2018
[3]点云数据体素建模及表达方法[D]. 赖广陵.解放军信息工程大学 2017
[4]三维点云数据配准方法研究[D]. 宋景豪.哈尔滨工程大学 2014
[5]三维点云数据配准方法研究[D]. 陈阳.天津大学 2014
[6]基于局部时空特征的人体行为识别以及打架行为检测[D]. 朱启兵.合肥工业大学 2012
[7]逆向工程中的点云处理[D]. 钱锦锋.浙江大学 2005
本文编号:3548229
【文章来源】:中北大学山西省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
感知机模型
中北大学学位论文8感知机是一个线性的二分类器,但不能对非线性数据有效的分类。而多层感知机通过添加激活函数,如线性整流函数(RectifiedLinearUnit,ReLU)、径向基函数(RadicalBasisFunction,RBF)、Sigmoid函数、双曲正切(tanh)函数等引入非线性因素,其理论上可以拟合任意复杂的函数,使得其可以处理感知机无法解决的线性不可分问题。多层感知机除去输入层(InputLayer)和输出层(OutputLayer)外,至少包括一个隐藏层(HiddenLayer),隐藏层由全连接层组成,见图2-2。图2-2多层感知机结构图Fig2-2Multilayerperceptronstructure2.1.2卷积神经网络真正意义上的卷积神经网络(ConvolutionalNeuralNetworks,CNN)是由YannLeCun于1989年提出的LeNet[25]。并于1998年在YannLeCun的博士论文中详细阐述了LeNet-5的原理[26],并应用于手写数字识别。但受限于当时的计算机硬件发展水平,没有足够规模的数据无法进行深度迭代的训练。2006年,Hinton提出的深度置信网络(DeepBeliefNetwork,DBN)[27],使得可以通过额外的预训练解决传统多层感知机或者神经网络中陷入局部最小值的问题。直到2012年,KrizhevskyA,SutskeverI,HintonGE等人在ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)图像分类任务中提出
中北大学学位论文9AlexNet[28]并取得冠军。随后提出的GoogLeNet[29]、VGG[30]也分别在ILSVRC竞赛中得了冠军和亚军的优秀成绩,至此深度学习在计算机视觉领域正式迎来了高速发展的时机。卷积神经网络的基本结构包含输入层(Inputlayer)、卷积层(Convolutional)、池化层(Poolinglayer)、全连接层(FullyConnectedLayer)及输出层五个部分,卷积层和池化层一般会交替设置。卷积神经网络的结构见图2.3,卷积神经网络具有如下特点:(1)权重共享:同一个卷积核可以滑动在不同位置进行卷积操作。(2)局部性:仅和层与层之间的部分节点有对应关系。(3)多尺度:通过级联卷积神经网络,可以将图像数据不断采样以减小数据量,从而可以获得更大的感受野(ReceptiveField)。图2-3VGG16模型[30]Fig2-3VGG16modelCNN中常见的卷积核类型有一维卷积核,主要用于只有一个维度的时间序列提取图2-4一维卷积Fig2-41DCNN特征,一维数据输入可以具有多个通道。但卷积核只能沿一个方向移动。单通道1D卷
【参考文献】:
期刊论文
[1]基于图卷积的计算机辅助设计模型分类[J]. 李梦吉,韩燮. 科学技术与工程. 2020(13)
[2]一种用于点云分类的轻量级深度神经网络[J]. 闫林,刘凯,段玫妤. 西安电子科技大学学报. 2020(02)
[3]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
博士论文
[1]三角网格模型的分割、评价及其应用研究[D]. 秦茂玲.山东师范大学 2013
硕士论文
[1]三维激光点云数据的处理及应用研究[D]. 孙钰科.上海师范大学 2018
[2]基于激光雷达的车前地形快速测量方法关键技术研究[D]. 孙政扬.吉林大学 2018
[3]点云数据体素建模及表达方法[D]. 赖广陵.解放军信息工程大学 2017
[4]三维点云数据配准方法研究[D]. 宋景豪.哈尔滨工程大学 2014
[5]三维点云数据配准方法研究[D]. 陈阳.天津大学 2014
[6]基于局部时空特征的人体行为识别以及打架行为检测[D]. 朱启兵.合肥工业大学 2012
[7]逆向工程中的点云处理[D]. 钱锦锋.浙江大学 2005
本文编号:3548229
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3548229.html