基于卷积神经网络的立体匹配技术研究
本文选题:立体匹配 切入点:匹配代价 出处:《浙江大学》2017年硕士论文 论文类型:学位论文
【摘要】:双目立体视觉是计算机视觉的关键技术之一,它在传统的三维场景重建、智能机器人导航、目标跟踪以及新兴的无人驾驶汽车、虚拟现实、移动终端等领域都具有广泛的应用。立体匹配作为双目立体视觉中最为重要的一个环节,一直是目前研究的焦点和热点。近年来,深度学习技术快速发展,在图像、语音、文本等领域获得了巨大的成功。卷积神经网络更是结合了深度学习技术、人工神经网络和图像局部关联性等特性,能有效提取图像特征,特别适用于计算机视觉任务,在图像分类、物体检测、目标跟踪等任务中取得了显著的成绩。目前,如何将卷积神经网络应用到立体匹配任务中,获得高准确率、快速的算法,仍是一个有待解决的问题。本文整理和总结了国内外关于深度学习和立体匹配技术的研究成果,以经典的卷积神经网络模型为基础,将其应用到立体匹配任务当中,主要工作如下:1)提出了一种基于卷积神经网络的匹配代价计算算法。在分析传统匹配代价算法原理和现有数据集限制的基础上,本文利用卷积神经网络计算图像块的匹配程度,避免了需要人工选择特征。实验结果表明,本文提出的基于卷积神经网络的匹配代价计算算法大幅减少了初始匹配误差,为后续步骤建立良好基础,且具有较好的光照鲁棒性。同时研究了卷积神经网络超参数对算法效果和速度的影响。2)提出了一种基于卷积神经网络的立体匹配算法框架。本文参考传统立体匹配四个步骤,使用基于卷积神经网络的匹配代价计算算法计算匹配代价,将半全局匹配算法和基于十字的代价聚合算法结合用于代价聚合,视差计算完成后使用多种后处理算法对初始视差图进行修正。通过在公开数据集的测试表明,本文提出的算法框架在准确度和性能上都已经达到了领域内先进水平。
[Abstract]:Binocular stereo vision is one of the key technologies of computer vision. It is used in traditional 3D scene reconstruction, intelligent robot navigation, target tracking, and emerging driverless cars, virtual reality, etc. Stereo matching, as the most important link in binocular stereo vision, has been the focus and hotspot of current research. In recent years, depth learning technology has developed rapidly in image, speech, speech, etc. The convolution neural network combines the characteristics of deep learning technology, artificial neural network and image local correlation, so it can extract image features effectively, especially for computer vision tasks. Significant achievements have been made in image classification, object detection, target tracking and so on. At present, how to apply convolution neural network to stereo matching task to obtain high accuracy and fast algorithm, It is still a problem to be solved. This paper summarizes the research results of depth learning and stereo matching at home and abroad, and applies them to stereo matching task based on classical convolution neural network model. The main work is as follows: (1) A matching cost calculation algorithm based on convolution neural network is proposed. On the basis of analyzing the principle of traditional matching cost algorithm and the limitation of existing data set, this paper uses convolutional neural network to calculate the matching degree of image block. The experimental results show that the proposed algorithm based on convolution neural network greatly reduces the initial matching error and establishes a good foundation for the following steps. At the same time, the effect of hyperparameter of convolution neural network on algorithm effect and speed. 2) A stereo matching algorithm framework based on convolution neural network is proposed. This paper refers to the four steps of traditional stereo matching. The matching cost calculation algorithm based on convolution neural network is used to calculate the matching cost. The semi-global matching algorithm and the cross-based cost aggregation algorithm are combined for the cost aggregation. After the parallax calculation is completed, a variety of post-processing algorithms are used to correct the initial parallax map. The experimental results in the open data set show that the proposed algorithm framework has reached the advanced level of accuracy and performance in the field.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP183
【相似文献】
相关期刊论文 前10条
1 王肇捷,黄文剑;立体匹配的免疫算法[J];电脑与信息技术;2001年04期
2 夏利民;谷士文;沈新权;孙星明;;一种新颖的立体匹配方法[J];模式识别与人工智能;2001年04期
3 王小芳;闫光荣;雷毅;;彩色镜像图像的立体匹配方法[J];计算机工程;2008年18期
4 裴明涛;刘鹏;;一种基于图割的快速立体匹配方法[J];北京理工大学学报;2009年03期
5 卢思军;唐振民;郭龙源;卢阿丽;;采用模糊判别的自适应多窗口立体匹配[J];工程图学学报;2009年06期
6 李洪海;;一种改进的快速立体匹配方法[J];自动化与仪器仪表;2010年04期
7 林川;潘盛辉;韩峻峰;谭光兴;李梦和;;基于区域的立体匹配优化方法[J];计算机工程与设计;2011年08期
8 胡楠;;立体匹配技术发展研究[J];信息通信;2012年05期
9 李竹林;张根耀;;基于特征的宽基线立体匹配技术研究[J];计算机技术与发展;2013年05期
10 林静;江开勇;林俊义;李莉君;;基于立体校正的快速相位立体匹配[J];贵州师范大学学报(自然科学版);2013年02期
相关会议论文 前10条
1 赵慧洁;雷彦章;姜宏志;;基于投影栅相位的立体匹配方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
2 刘晓丽;徐光柱;雷帮军;孙水发;冯德鸿;;立体匹配技术研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
3 王跃宗;刘冲;李德胜;;彩色显微图像立体匹配研究[A];中国微米、纳米技术第七届学术会年会论文集(一)[C];2005年
4 付丽琴;韩焱;;基于立体匹配技术的射线图像三维信息重建技术研究[A];第十一届中国体视学与图像分析学术会议论文集[C];2006年
5 李竹林;赵宗涛;王文发;马燕;;一种缺失摄像机标定参数图像的立体匹配方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
6 周秀芝;王润生;;基于自适应窗口的稠密立体匹配[A];立体图象技术及其应用研讨会论文集[C];2005年
7 贾涛;陈涛;杨润奎;;基于仿射不变量的长基线立体匹配[A];第三届全国信息获取与处理学术会议论文集[C];2005年
8 左森;郭晓松;万敬;郭君斌;;Graph Cuts及其在立体匹配中的应用[A];立体图象技术及其应用研讨会论文集[C];2005年
9 李刚;曾荣盛;韩建涛;陈曾平;;基于双向SIFT的未标定图像的立体匹配[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
10 纪松;范大昭;初艳锋;杨靖宇;;线阵遥感影像多视立体匹配中VLL模型的扩展[A];第十七届全国测控计量仪器仪表学术年会(MCMI'2007)论文集(上册)[C];2007年
相关博士学位论文 前10条
1 张康;基于图像深度感知中的立体匹配和深度增强算法研究[D];清华大学;2015年
2 黄经州;高分辨率近似纹理图像立体匹配技术研究[D];浙江大学;2015年
3 柴登峰;面向三维可视通讯的立体匹配方法[D];浙江大学;2006年
4 卢思军;立体匹配关键技术研究[D];南京理工大学;2011年
5 胡腾;基于多通道置信度传播算法的航空核线影像稠密立体匹配研究[D];武汉大学;2013年
6 李莉;基于偏微分方程的立体匹配问题研究[D];山东大学;2011年
7 裴伟;显微立体匹配及非接触无损快速三维测量研究[D];大连理工大学;2007年
8 葛亮;图像建模中立体匹配问题的研究[D];重庆大学;2009年
9 耿英楠;立体匹配技术的研究[D];吉林大学;2014年
10 刘正东;计算机视觉中立体匹配技术的研究[D];南京理工大学;2005年
相关硕士学位论文 前10条
1 王龙;摄像机标定与立体匹配技术的研究[D];河北大学;2015年
2 刘荣军;宽基线密集立体匹配方法研究[D];昆明理工大学;2015年
3 朱守信;基于立体匹配片的国产卫星影像无缝立体测图方法研究[D];中国地质大学(北京);2015年
4 庞星;双目立体匹配的理论研究及算法优化[D];南京理工大学;2015年
5 夏凯;双目视觉立体匹配技术研究及其应用[D];西安建筑科技大学;2015年
6 王侃;人体头部姿态参数测量[D];西安工业大学;2015年
7 龚文彪;立体匹配技术的研究及其硬件化实现[D];南京理工大学;2015年
8 邱明R,
本文编号:1630177
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1630177.html