基于卷积神经网络的双目立体视觉匹配算法研究

发布时间:2021-06-11 07:04
  双目立体视觉是计算机视觉领域内的一项重要研究课题,它通过一个场景在不同视角下捕获的多个二维成像可以重建3D场景,在无人驾驶、虚拟现实和机器人等领域有着广泛的应用前景。立体匹配是双目立体技术中的最重要、最困难的一个环节,立体匹配的目标是通过给定立体相机拍摄到的两个图像,计算参考图像中的每个像素的视差,得到视差图从而计算深度。传统的方法一般遵循四步流程:匹配代价计算、代价聚合、视差计算和视差优化,但是这种手工制作特征描述符的方法往往受到效率低下的困扰。最近几年,由于卷积神经网络超强的特征提取能力,一度取代了传统手工制作特征描述符的方法。基于神经网络的方法可以将视差估计看成一项学习任务,利用大量数据不断优化模型参数进行学习,使用学习过后的神经网络模型处理输入图像输出视差图。相对于传统立体匹配方法,基于卷积神经网络的方法可以更好地捕获局部上下文信息,对于不适定区域(遮挡、弱纹理和深度不连续等)的表现更加鲁棒,在匹配速度和精度方面都有了不错的提升。本文对双目立体视觉匹配算法的国内外研究现状和重难点问题做了深入的了解和研究,针对传统四步法中多步骤、多模块的任务处理方式导致的一些问题,容易造成误差累... 

【文章来源】:青岛理工大学山东省

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于卷积神经网络的双目立体视觉匹配算法研究


Middlebury2001数据集

数据集,图像,立体匹配,双目


青岛理工大学工程硕士学位论文20两组数据集都为训练图像提供了真实的场景视差图,并且可通过在线排行榜的方式对立体匹配算法进行评估。两组数据集图像描绘的场景多为市区、乡村和高速公路等自动驾驶场景图像。其包含了不同的场景、不同的光照和遮挡等多种图像处理数据,给双目视觉研究人员带来了巨大便利。下图为KITTI2015数据集的部分图像,依次为左图像、右图像和视差图。图2.7KITTI2015数据集部分图像2.5本章小结在这一章节主要对双目立体视觉和立体匹配的基本理论和概念做了介绍,首先介概述了双目立体匹配视觉图像获娶立体矫正、立体匹配和三维重建这四个步骤,依次介绍各个步骤的主要任务和内容。然后介绍了双目立体视觉的原理,包括摄像机的成像原理以及坐标变换过程中用的四个坐标系:世界坐标系、相机坐标系、图像坐标系、像素坐标系,并详细介绍了四个坐标系的内容和转换关系。然后介绍了图像修正过程中用到的极线约束和立体校正的原理及内容。详细概述了双目视觉深度感知原理与深度计算的内容。总结了立体匹配算法的(1)匹配代价计算(2)代价聚合(3)视差计算(4)视差优化四个步骤的具体任务和方法,并详细介绍了局部匹配算法和全局匹配算法的区别和特点。最后介绍了衡量立体匹配算

激活函数,函数


青岛理工大学工程硕士学位论文25(1)Sigmoid激活函数函数的定义为:1()1xfxe=+(3-4)其值域为(0,1)。图3.2sigmoid激活函数如上图所示,sigmoid函数使用较早也是目前用的最多的激活函数之一,它呈指数函数形状,这种具有抑制性的函数十分符合物理上的神经元的特性。sigmoid函数能够把输入连续实值变换为0和1之间的输出,由于其单调连续、输出范围确定、易于求导等特性,非常适用于输出层作为激活函数,也经常表示成元素的概率或者用于数据的归一化。Sigmoid函数用作神经网络的激活函数有三个主要缺陷:软饱和性导致的梯度消失问题,即x趋于无穷时函数的两侧导数逐渐趋于0,在反向传播跟新参数时梯度相乘的结果逐步趋于0导致梯度在传播过程中逐渐消失,前层神经网络的参数难以更新;sigmoid函数的值域导致偏置现象,即函数输出并非以0为中心而是全大于0的,那么在前向计算过程中后层神经元得到的都是前层神经元传递的非0均值输入数据,导致在反向传播时权重w的变化要么全正要么全负使得权重更新不理想;sigmoid函数是一种幂运算函数,运算量大使得训练相对麻烦。(2)Tanh激活函数函数的定义为:-()tanh()1xxxeefxxe=+(3-5)其值域为(-1,1)。

【参考文献】:
期刊论文
[1]人工神经网络的发展综述[J]. 夏瑜潞.  电脑知识与技术. 2019(20)
[2]结合CNN与分割约束的立体匹配算法[J]. 马伟,李曈,龚超凡,丁治明.  北京工业大学学报. 2019(05)
[3]基于多尺度卷积神经网络的立体匹配方法[J]. 习路,陆济湘,涂婷.  计算机工程与设计. 2018(09)
[4]一种“客观度量”和“深度学习”共同驱动的立体匹配方法[J]. 董惠心,任鹏,余兴瑞,王廷伟.  现代电子技术. 2018(01)
[5]人工神经网络发展现状综述[J]. 王广.  中小企业管理与科技(下旬刊). 2017(02)
[6]基于改进梯度和自适应窗口的立体匹配算法[J]. 祝世平,李政.  光学学报. 2015(01)
[7]基于Census变换和改进自适应窗口的立体匹配算法[J]. 周龙,徐贵力,李开宇,王彪,田裕鹏,陈欣.  航空学报. 2012(05)
[8]宽基线图像特征点的立体匹配[J]. 陈望明,刘连芳.  计算机应用研究. 2008(12)
[9]人工神经网络研究与发展综述[J]. 王辉.  电脑知识与技术. 2008(30)
[10]自适应窗口快速立体匹配[J]. 周秀芝,文贡坚,王润生.  计算机学报. 2006(03)

硕士论文
[1]基于卷积神经网络的立体匹配技术研究[D]. 陈拓.浙江大学 2017
[2]双目立体视觉匹配方法研究[D]. 王杰琼.昆明理工大学 2016
[3]基于深度学习的立体匹配研究[D]. 戴杰.北京邮电大学 2016



本文编号:3224069

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3224069.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ff023***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com