基于深度学习的单目图像深度估计研究

发布时间:2022-08-01 12:20
  深度信息是智能系统实现场景理解的基础,单目图像深度估计作为一个比较基础的视觉任务,可以为许多高级任务提供深度信息,在自动驾驶、增强现实、虚拟现实等任务中有着巨大的应用前景,可以说是一个相当重要的研究课题。虽然现在已经出现了一些可以用于获取深度信息的设备,比如深度相机、激光雷达,但是在室外场景下它们不能获得令人满意的深度值。相比于双目和多目深度估计方法,单目深度估计方法获取数据简单、成本低廉,可以得到一张全分辨率的深度图,为深度信息的获取提供了一条全新的研究思路。正是因为单目图像深度估计方法具有重要的研究价值,本文基于深度学习方法对室外场景下的单目图像深度估计进行了研究,主要研究内容如下:1、针对室外场景下的单目深度估计任务,在第三章中提出了一种基于编解码结构和分阶段优化策略设计的单目深度估计算法。这个模型由两部分组成,第一部分选择使用当前最先进的单目深度估计体系中的编解码结构,第二部分使用CSPN作为后处理模块,可以对第一部分产生的不够细粒度的深度图进行优化。虽然使用分阶段策略,但是最终的模型整体上还是一个端到端结构,训练与测试过程并不复杂。在面向室外场景的公开数据集KITTI上对模型... 

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 论文研究背景及意义
    1.2 主要研究现状
        1.2.1 早期的单目图像深度估计
        1.2.2 基于深度学习方法的单目图像深度估计
        1.2.3 面临的问题和挑战
    1.3 论文主要研究内容与创新点
    1.4 论文章节安排
第二章 预备知识
    2.1 卷积神经网络
        2.1.1 卷积层
        2.1.2 池化层
        2.1.3 全连接层
        2.1.4 激活函数
    2.2 卷积空间传播网络
        2.2.1 各向异性扩散滤波
        2.2.2 CSPN工作方式
    2.3 本章小结
第三章 基于编解码结构和后处理的单目深度估计模型
    3.1 引言
    3.2 网络模型结构及原理
        3.2.1 残差编码模块
        3.2.2 上采样模块
        3.2.3 编解码结构模型的实现细节
        3.2.4 CSPN优化模块
    3.3 损失函数
    3.4 实验结果及分析
        3.4.1 实现细节
        3.4.2 评价指标
        3.4.3 使用不同损失函数对实验效果的影响
        3.4.4 真实深度值采样点的个数对实验效果的影响
        3.4.5 与其他方法的对比实验
    3.5 本章小结
第四章 基于特征对齐与后处理的单目深度估计模型
    4.1 引言
    4.2 网络模型结构及原理
        4.2.1 特征对齐模块
        4.2.2 特征融合模块
        4.2.3 后处理模块
    4.3 实验结果
        4.3.1 实现细节
        4.3.2 帧序列中包含不同的帧数对实验结果的影响
        4.3.3 与其他算法的对比实验
        4.3.4 特征对齐模块的有效性
    4.4 本章小结
第五章 轻量化处理后的单目深度估计模型
    5.1 引言
    5.2 轻量化FA-CSPN模型设计
        5.2.1 可分离卷积
        5.2.2 对FA-CSPN模型进行轻量化处理
    5.3 图像集合损失函数
    5.4 实验
        5.4.1 轻量化处理前后的模型对比
        5.4.2 使用不同损失函数对实验结果的影响
        5.4.3 使用不同的正则化系数对实验结果的影响
        5.4.4 与其他方法进行比较的实验结果
    5.5 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
攻读学位期间发表的学术论文目录


【参考文献】:
期刊论文
[1]基于FFT和全连接层特征提取的轴承故障诊断(英文)[J]. 王萌,曾艳,刘金童,刘小杰,彭飞.  机床与液压. 2020(24)
[2]改进深度可分离卷积的SSD车型识别[J]. 郭融,王芳,刘伟.  重庆大学学报. 2021(06)
[3]基于深度学习的目标检测技术的研究综述[J]. 罗元,王薄宇,陈旭.  半导体光电. 2020(01)
[4]基于深度学习的图像识别技术研究综述[J]. 张琦,张荣梅,陈彬.  河北省科学院学报. 2019(03)
[5]基于深度学习的图像语义分割技术研究综述[J]. 邝辉宇,吴俊君.  计算机工程与应用. 2019(19)
[6]基于改进卷积神经网络的多视角人脸表情识别[J]. 钱勇生,邵洁,季欣欣,李晓瑞,莫晨,程其玉.  计算机工程与应用. 2018(24)
[7]基于监督学习的单幅图像深度估计综述[J]. 毕天腾,刘越,翁冬冬,王涌天.  计算机辅助设计与图形学学报. 2018(08)
[8]2维至3维图像/视频转换的深度图提取方法综述[J]. 李可宏,姜灵敏,龚永义.  中国图象图形学报. 2014(10)
[9]基于物体几何性质的单幅图像三维重建[J]. 石仁爱,赵志刚,吕慧显,赵毅.  青岛大学学报(自然科学版). 2013(01)
[10]基于计算机视觉的深度估计方法[J]. 江静,张雪松.  光电技术应用. 2011(01)

硕士论文
[1]图像的视觉显著性分析与应用研究[D]. 杨胜辉.海南大学 2016



本文编号:3667436

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3667436.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8c501***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com