基于深度学习的单目视觉三维点云重建技术研究

发布时间：2021-10-05 10:51

　　通过CAD等三维制作软件在虚拟三维空间中构建三维数据模型是常用的三维建模方法。然而在面对数量巨大,复杂度很高的建模任务时,重构所花费的时间、人力成本是十分巨大的。基于双目、三目视觉的自动建模方法虽然较好的解决了复杂建模技术人力和时间成本花费巨大的问题,但这些方法对于设备的依赖性过高。本文研究并提出了一种基于深度学习的单目视觉三维点云重构技术,可以有效的降低人工建模的成本,同样又避免了使用深度相机所需的设备成本及环境的局限性。本文首先提出了一种基于残差网络的三维点云重构网络3D-ReConstnet。该网络使用了残差卷积神经网络来提取图片的特征,避免了深度神经网络容易出现梯度爆炸或梯度消失的问题,同时避免了深度神经网络难以训练的问题。之后,本文使用Chamfer距离（Chamfer distance）和EM距离（Earth Mover’s distance）作为损失函数来优化生成模型的效果,能够正确评估点云分布,避免了评估不正确的问题。同时,两种评估函数的双约束也可能解决重建模型过于分散或过于集中的问题。在ShapeNet和Pix3D两个CAD三维模型数据集上的实验结果证明了提出的深度三...

【文章来源】：东北电力大学吉林省

【文章页数】：53 页

【学位级别】：硕士

【部分图文】：

图２－１卷积核的卷积过程??如图２－１所示，卷积核上的祌经元仅与图像的部分区域进行连接，每次都可以提取一??个局部区域内的特征信息

残差图,残差,基本块

差。与一??般的ＣＮＮ网络模型直接学习输入输出的映射相比，残差网络要更加容易学习、收敛速度??也更快，并且因为残差网络可以有效的训练更深层的神经网络，该方案最终得到的结果也??会更加精确。??ｃｏｎｖ?Ｉ?＝?Ｉ?趾ｕ?Ｉ￣Ｈ?ｃｏｎｖ?Ｉ?＝?Ｉ?■?臟?Ｉ?￣￣Ｈ?Ｒａ－ｕ??（ａ）??．〇〇Ｎ＼－?？ａｔＧｈ?ＲｅＬＵ??？?ＣＯＮ＼Ｊ?？ａｔ〇ｈ?ＲｅＬＵ?——？?ＣＯＮＶ?？ａｔｃＵ?—？（??？?ＲｅＬＵ??Ｎｏｒｍ?Ｎｏｒｍ?Ｎｏｔｕ?Ｖ?Ｊ??（ｂ）??图２－２两种残差块结构??残差网络中包含了两种结构的基本块。如图２－２（ａ）所示，当输入数据的维度和经过残??差块进行计算后的输出维度相同时，网络使用映射块（Ｉｄｅｎｔｉｔｙ?Ｂｌｏｃｋ），即直接将自身的信息??传递给残差块的计算结果，并与该计算结果相加。如图２－２（ｂ）所示，当输入维度和输出维??度不一致时，两者的通道数不同，不能直接进行计算，快捷连接上会使用卷积块（ｃ〇ｎｖＢ１〇ｃｋ）??来保证输出信息的通道数与残差块计算结果的通道数保持一致，之后再将两者相加。??如图２－３所示，以一个残差块为例，ｘ表示输入的数据，表示经过残差块学习后的??输出，通过快捷连接网络可以将原始输入信息直接传递到后层。传统的卷积神经网络??（Ｃｏｎｖｏｌｕｔｉｏｎａｌ?Ｎｅｕｒａ】?Ｎｅｔｗｏｒｋｓ，?ＣＮＮ）或全连接神经网络（Ｆｕｌｌｙ?Ｃｏｎｖｏｌｕｔｉｏｎａｌ?Ｎｅｔｗｏｒｋｓ，??ＦＣＮ）在信息传递的过程中不可避免的会存在信息丢失的问题，残差网络通过直接将输入数??据传递给网络层输出结果的方法可以保证信息传递的完整性。残差网络中一个残差块的最??终输出的

网络结构图,残差,梯度,神经网络

?第２章三维点云重构相关技术介绍???．Ｖ??ｉ???Ｗｅｉｇｈｔ?Ｌａｙｅｒ??Ｆ（ｘ）?－ｊ?Ｘ??…丨??ｉｄｅｎｔｉｔｙ??！?ｍａｐｐｉｎｇ??ｗｅｉｇｈｔ?Ｌａｙｅｒ??ｊ??ｉ??：＋????ｒ?ｆｘ）?＋?ｘ??士??图２－３残差块结构??此外，在深层神经网络中使用残差网络结构还可以有效缓解梯度爆炸和梯度消失的问??题。相比较于直接增加网络层数的框架，残差网络（Ｒｅｓｉｄｕａｌ?ｎｅｔｗｏｒｋ，?ＲｅｓＮｅｔ）中有很多跨层??连接结构，这样的结构在反向传播的过程中有着很大的优势。反向传播算法是神经网络中??一项用于更新Ｍ络参数的常用的技术。根据链式求导法则，网络会按照负梯度方向对参数??进行调整更新梯度信息，其本质就是计算损失与其权重的偏导，当学习率为《时，每次下??降的梯度为：??ｄＬｏｓｓ??Ａｗ?＝?－ａ??（２－２）??ｄｗ??根据链式求导法则可知，当隐藏层非常多的时候，第ｉ层的梯度更新如公式２－３所示，??其中，为第ｉ个隐藏层的输出结果。??Ａ?ｄＬｏｓｓ?ｄＬｏｓｓ?ｄｆｎ?ｄｆ．，?ｄｆ．??ｄｆｎ?ｄｆｎ＿，?ｄｆ，?ｄｗ，??从上述公式可以发现，当中间两层的偏导数大于１时，随着网络层数的增多，最终的??求出的梯度更新将以指数形式增加，最终导致梯度爆炸。当该值小于１时，计算的梯度更??新信息将会以指数形式衰减，最终导致梯度消失。??而针对残差网络而言，当第Ｌ个残差块的输出结果为＆时，则第Ｌ＋／个残差块和第??Ｌ＋２个残差块的结果为：??ｘｕｉ＝ｘｌ?＋?ｆ（ｘｌ＾ｗｌ）?（２－４）??ｘｉ．＋２?＝?ｘｕｉ?＋?Ｆ（ｘＬ＋ｉ＾

【参考文献】：
期刊论文
[1]基于稀疏激光点云数据和单帧图像融合的三维重构算法[J]. 贺秉安,曾兴,李子奇,万生鹏.  计测技术. 2017(03)
[2]基于自适应权值滤波的深度图像超分辨率重建[J]. 杨宇翔,曾毓,何志伟,高明煜.  中国图象图形学报. 2014(08)
[3]基于激光与可见光同步数据的室外场景三维重建[J]. 张爱武,胡少兴,孙卫东,李风亭.  电子学报. 2005(05)

硕士论文
[1]脑血管点云三维重建及其血流动力学分析[D]. 刘志强.哈尔滨工业大学 2018
[2]深度图像超分辨率重建算法研究[D]. 涂义福.合肥工业大学 2016
[3]基于TOF深度图的超分辨率重建算法[D]. 董文菁.合肥工业大学 2015

本文编号：3419586

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shoufeilunwen/xixikjs/3419586.html

上一篇：基于物联网的供水管网监测系统的研究与设计
下一篇：基于BIM的铝模板设计建造一体化技术研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|