基于深度学习的单目视觉三维点云重建技术研究

发布时间:2021-10-05 10:51
  通过CAD等三维制作软件在虚拟三维空间中构建三维数据模型是常用的三维建模方法。然而在面对数量巨大,复杂度很高的建模任务时,重构所花费的时间、人力成本是十分巨大的。基于双目、三目视觉的自动建模方法虽然较好的解决了复杂建模技术人力和时间成本花费巨大的问题,但这些方法对于设备的依赖性过高。本文研究并提出了一种基于深度学习的单目视觉三维点云重构技术,可以有效的降低人工建模的成本,同样又避免了使用深度相机所需的设备成本及环境的局限性。本文首先提出了一种基于残差网络的三维点云重构网络3D-ReConstnet。该网络使用了残差卷积神经网络来提取图片的特征,避免了深度神经网络容易出现梯度爆炸或梯度消失的问题,同时避免了深度神经网络难以训练的问题。之后,本文使用Chamfer距离(Chamfer distance)和EM距离(Earth Mover’s distance)作为损失函数来优化生成模型的效果,能够正确评估点云分布,避免了评估不正确的问题。同时,两种评估函数的双约束也可能解决重建模型过于分散或过于集中的问题。在ShapeNet和Pix3D两个CAD三维模型数据集上的实验结果证明了提出的深度三... 

【文章来源】:东北电力大学吉林省

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

基于深度学习的单目视觉三维点云重建技术研究


图2-1卷积核的卷积过程??如图2-1所示,卷积核上的祌经元仅与图像的部分区域进行连接,每次都可以提取一??个局部区域内的特征信息

残差图,残差,基本块


差。与一??般的CNN网络模型直接学习输入输出的映射相比,残差网络要更加容易学习、收敛速度??也更快,并且因为残差网络可以有效的训练更深层的神经网络,该方案最终得到的结果也??会更加精确。??conv?I?=?I?趾u?I ̄H?conv?I?=?I?■?臟?I? ̄ ̄H?Ra-u??(a)??.〇〇N\-??atGh?ReLU????CON\J??at〇h?ReLU?——??CONV??atcU?—?(????ReLU??Norm?Norm?Notu?V?J??(b)??图2-2两种残差块结构??残差网络中包含了两种结构的基本块。如图2-2(a)所示,当输入数据的维度和经过残??差块进行计算后的输出维度相同时,网络使用映射块(Identity?Block),即直接将自身的信息??传递给残差块的计算结果,并与该计算结果相加。如图2-2(b)所示,当输入维度和输出维??度不一致时,两者的通道数不同,不能直接进行计算,快捷连接上会使用卷积块(c〇nvB1〇ck)??来保证输出信息的通道数与残差块计算结果的通道数保持一致,之后再将两者相加。??如图2-3所示,以一个残差块为例,x表示输入的数据,表示经过残差块学习后的??输出,通过快捷连接网络可以将原始输入信息直接传递到后层。传统的卷积神经网络??(Convolutional?Neura】?Networks,?CNN)或全连接神经网络(Fully?Convolutional?Networks,??FCN)在信息传递的过程中不可避免的会存在信息丢失的问题,残差网络通过直接将输入数??据传递给网络层输出结果的方法可以保证信息传递的完整性。残差网络中一个残差块的最??终输出的

网络结构图,残差,梯度,神经网络


?第2章三维点云重构相关技术介绍???.V??i???Weight?Layer??F(x)?-j?X??…丨??identity??!?mapping??weight?Layer??j??i??:+????r?fx)?+?x??士??图2-3残差块结构??此外,在深层神经网络中使用残差网络结构还可以有效缓解梯度爆炸和梯度消失的问??题。相比较于直接增加网络层数的框架,残差网络(Residual?network,?ResNet)中有很多跨层??连接结构,这样的结构在反向传播的过程中有着很大的优势。反向传播算法是神经网络中??一项用于更新M络参数的常用的技术。根据链式求导法则,网络会按照负梯度方向对参数??进行调整更新梯度信息,其本质就是计算损失与其权重的偏导,当学习率为《时,每次下??降的梯度为:??dLoss??Aw?=?-a??(2-2)??dw??根据链式求导法则可知,当隐藏层非常多的时候,第i层的梯度更新如公式2-3所示,??其中,为第i个隐藏层的输出结果。??A?dLoss?dLoss?dfn?df.,?df.??dfn?dfn_,?df,?dw,??从上述公式可以发现,当中间两层的偏导数大于1时,随着网络层数的增多,最终的??求出的梯度更新将以指数形式增加,最终导致梯度爆炸。当该值小于1时,计算的梯度更??新信息将会以指数形式衰减,最终导致梯度消失。??而针对残差网络而言,当第L个残差块的输出结果为&时,则第L+/个残差块和第??L+2个残差块的结果为:??xui=xl?+?f(xl^wl)?(2-4)??xi.+2?=?xui?+?F(xL+i^

【参考文献】:
期刊论文
[1]基于稀疏激光点云数据和单帧图像融合的三维重构算法[J]. 贺秉安,曾兴,李子奇,万生鹏.  计测技术. 2017(03)
[2]基于自适应权值滤波的深度图像超分辨率重建[J]. 杨宇翔,曾毓,何志伟,高明煜.  中国图象图形学报. 2014(08)
[3]基于激光与可见光同步数据的室外场景三维重建[J]. 张爱武,胡少兴,孙卫东,李风亭.  电子学报. 2005(05)

硕士论文
[1]脑血管点云三维重建及其血流动力学分析[D]. 刘志强.哈尔滨工业大学 2018
[2]深度图像超分辨率重建算法研究[D]. 涂义福.合肥工业大学 2016
[3]基于TOF深度图的超分辨率重建算法[D]. 董文菁.合肥工业大学 2015



本文编号:3419586

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3419586.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2d53d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com