基于深度学习的多视图三维目标分类方法研究

发布时间：2020-05-22 23:45

【摘要】：三维目标分类是计算机视觉领域中一个重要的研究课题,良好的分类性能可以为后续的高级处理提供支持。传统分类方法通过人工提取数据特征,不足之处是人工设定费时费力且依赖主观经验,而深度学习模型能够自动学习数据的深层特征,减少了人工分类的主观性,准确率相对较高。多视图表示是三维模型的重要表示之一,符合人眼对目标的视觉感知,可以作为深度学习模型的输入数据。本文针对基于深度学习的多视图三维目标分类问题,研究了三维模型的多视图表示及选择方法,并采用深度学习模型对三维目标进行分类,旨在提高准确率的同时进一步提高计算速度。本文的主要工作如下:(1)针对多视点视图数据缺少视图间的关联信息问题,本文提出了三维模型的多视点与全景视图表示方法。本文首先构建了三维模型的多视点视图数据,在此基础上进一步构建了全景视图数据,增加了视图间的关联信息,并把两者结合起来,形成完整的多视图数据集,以获得模型的完整信息,解决多视点视图的信息缺失问题,实验表明该模型表示方法的有效性。(2)针对多视图数据样本较多且存在大量冗余模糊特征的问题,本文基于构建的多视图数据集提出了多视图显著性分析与选择算法。本文首先通过梯度计算来分析多视图的显著性,根据梯度对视图进行排序,在此基础上选择特征显著的视图,解决计算效率不高的问题,在公共数据集上的实验结果表明多视图分析与选择算法的有效性。(3)针对多视图中的单个视图特征信息较少、特征描述不充分的问题,本文在多视图数据构建、分析和选择的基础上提出了基于聚合特征描述的多视图分类模型。本文首先对多视图进行池化,把多个视图的特征信息聚合起来,生成代表该三维模型的聚合描述子,在此基础上基于VGG-M模型实现对多视图的分类,在公共数据集上的实验结果表明基于聚合特征描述的分类模型具有较好的分类效果。
【图文】：

三角形网格,三维模型,多边形网格,传统分类

分别介绍了传统分类方法和深度学习方法中的多视图表示。逡逑２．１．１常见的三维模型表示逡逑数据库中的三维模型通常保存为多边形网格，如图２－１所示为ＭｏｄｅｌＮｅｔ数据逡逑集中的三角形网格。逡逑\l逡逑图２－１邋ＭｏｄｅｌＮｅｔ中的三角形网格［１５］逡逑Ｆｉｇｕｒｅ邋２－１邋Ｔｒｉａｎｇｌｅ邋ｍｅｓｈ邋ｉｎ邋ＭｏｄｅｌＮｅｔ１１５１逡逑９逡逑

三维模型,点云

在实际应用中，研宄者通常会根据实验要求将三维模型转换成不同的表现形逡逑式，以完成各种各样的任务。常见的输入表示有体素表示、点云表示和视图表示。逡逑三维模型的不同表示如图２－２所示，，从左到右依次是３０＊３０＊３０的体素网格、含有逡逑２０４８个点的点云集合以及渲染视图。逡逑（ａ）体素逦（ｂ）点云逦（ｃ）视图逡逑图２－２三维模型的不同表示［１５］逡逑Ｆｉｇｕｒｅ邋２－２邋Ｄｉｆｆｅｒｅｎｔ邋ｒｅｐｒｅｓｅｎｔａｔｉｏｎｓ邋ｏｆ邋３Ｄ邋ｍｏｄｅｌｓ［１５］逡逑与图像中的像素概念类似，体素（Ｖｏｘｅｌ）可以理解为二维像素在三维空间的逡逑推广。体素化能够对三维模型进行简化，得到均匀的网格。输入三角面片，输出逡逑体素化网格。在基于体素的表示中，代表性工作是Ｗｕ等人提出的３ＤＳｈａｐｅＮｅｔｓ，逡逑作者将三维模型体素化，将其表示为体素网格上二元变量的概率分布，然后输入逡逑到深度信念网络中进行训练。在ＭｏｄｅｌＮｅｔｌＯ数据集上，平均分类准确率为８３．５４％；逡逑在ＭｏｄｅｌＮｅｔ４０数据集上，平均分类准确率为７７．３２％。后来，研究者利用体素网格逡逑的稀疏性提出很多方法来提高计算速度。逡逑在逆向工程中，通过测量设备得到的三维目标表面点的数据集合称为点云逡逑（ＰｏｉｎｔＣｌｏｕｄ）。在基于点云的表示中
【学位授予单位】：北京交通大学
【学位级别】：硕士
【学位授予年份】：2019
【分类号】：TP391.41;TP18

【参考文献】