基于卷积神经网络和双目视差的无监督深度预测
发布时间:2022-01-25 23:19
深度预测作为计算机视觉领域的重要方向之一,使计算机可以通过二维图像估计出场景的深度信息。同时,卷积神经网络凭借其强大的图像特征提取和函数拟合能力,在场景的深度预测方向应用后取得了良好的效果。但是,许多基于卷积神经网络的深度预测方法需要大量的真实深度信息作为训练数据,而真实深度信息的获取受设备和环境的影响,需要投入大量的人力物力。针对上述问题,本文提出了基于卷积神经网络和双目视差的无监督深度预测方法。本文具体工作如下:第一,针对目前深度预测方法需要大量真实深度数据进行训练的问题,本文提出的无监督深度预测方法,利用卷积神经网络拟合一个非线性函数估计场景深度信息,再结合左右图像之间存在的视差,实现无监督的预测场景深度信息。由于左右图像之间的视差不仅与深度信息之间存在非线性关系,还与左右相机之间位置的变换存在紧密的联系,因此本文方法还可以进一步的估计左右相机之间的相对运动。本文提出的无监督深度预测方法,在不需要任何真实深度信息的情况下,只以左右图像作为输入,就可以通过端到端的训练,估计出场景的深度信息和左右相机之间的旋转平移关系。第二,对于本文深度预测方法所使用的神经网络,为了提高该神经网络预...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 传统深度预测方法
1.2.2 基于机器学习的深度预测方法
1.3 本文的主要研究内容
1.4 本文的组织结构
1.5 本章小结
第2章 相关技术介绍
2.1 相机模型及其坐标变换
2.1.1 像素坐标系与像平面坐标系之间的转换
2.1.2 像平面坐标系与相机坐标系之间的转换
2.1.3 相机坐标系与世界坐标系之间的转换
2.1.4 世界坐标系与像素坐标系之间的转换
2.2 旋转矩阵与四元数
2.2.1 旋转矩阵性质
2.2.2 四元数与旋转矩阵
2.3 卷积神经网络
2.3.1 卷积
2.3.2 反卷积
2.3.3 激活函数
2.3.4 批规范化
2.3.5 池化
2.4 KITTI数据集
2.4.1 数据集采集方式
2.4.2 数据集内容
2.5 本章小结
第3章 基于双目视差的无监督深度预测方法
3.1 本文方法概述
3.2 投影位置的计算
3.2.1 左图像像素坐标系变换到左相机坐标系
3.2.2 左相机坐标系变换到右相机坐标系
3.2.3 右相机坐标系变换到右图像像素坐标系
3.3 生成形变的右图像
3.4 损失函数的构建
3.5 误差的反向传播
3.5.1 损失函数梯度的计算
3.5.2 四元数梯度的计算
3.5.3 平移分量梯度的计算
3.5.4 深度值梯度的计算
3.6 本章小结
第4章 无监督深度预测网络
4.1 网络层参数
4.2 特殊的网络结构
4.2.1 特征图的通道合并
4.2.2 全卷积网络
4.2.3 跳跃结构
4.3 反卷积层的构建
4.4 本章小节
第5章 实验结果及分析
5.1 实验环境
5.2 实验数据处理
5.3 参数设置
5.3.1 网络训练参数设置
5.3.2 自定义层参数设置
5.4 实验结果对比
5.5 实验结果分析
5.6 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
致谢
【参考文献】:
期刊论文
[1]图像分割方法综述研究[J]. 周莉莉,姜枫. 计算机应用研究. 2017(07)
硕士论文
[1]基于深度学习的单目图像深度估计[D]. 李耀宇.哈尔滨理工大学 2017
本文编号:3609367
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 传统深度预测方法
1.2.2 基于机器学习的深度预测方法
1.3 本文的主要研究内容
1.4 本文的组织结构
1.5 本章小结
第2章 相关技术介绍
2.1 相机模型及其坐标变换
2.1.1 像素坐标系与像平面坐标系之间的转换
2.1.2 像平面坐标系与相机坐标系之间的转换
2.1.3 相机坐标系与世界坐标系之间的转换
2.1.4 世界坐标系与像素坐标系之间的转换
2.2 旋转矩阵与四元数
2.2.1 旋转矩阵性质
2.2.2 四元数与旋转矩阵
2.3 卷积神经网络
2.3.1 卷积
2.3.2 反卷积
2.3.3 激活函数
2.3.4 批规范化
2.3.5 池化
2.4 KITTI数据集
2.4.1 数据集采集方式
2.4.2 数据集内容
2.5 本章小结
第3章 基于双目视差的无监督深度预测方法
3.1 本文方法概述
3.2 投影位置的计算
3.2.1 左图像像素坐标系变换到左相机坐标系
3.2.2 左相机坐标系变换到右相机坐标系
3.2.3 右相机坐标系变换到右图像像素坐标系
3.3 生成形变的右图像
3.4 损失函数的构建
3.5 误差的反向传播
3.5.1 损失函数梯度的计算
3.5.2 四元数梯度的计算
3.5.3 平移分量梯度的计算
3.5.4 深度值梯度的计算
3.6 本章小结
第4章 无监督深度预测网络
4.1 网络层参数
4.2 特殊的网络结构
4.2.1 特征图的通道合并
4.2.2 全卷积网络
4.2.3 跳跃结构
4.3 反卷积层的构建
4.4 本章小节
第5章 实验结果及分析
5.1 实验环境
5.2 实验数据处理
5.3 参数设置
5.3.1 网络训练参数设置
5.3.2 自定义层参数设置
5.4 实验结果对比
5.5 实验结果分析
5.6 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
致谢
【参考文献】:
期刊论文
[1]图像分割方法综述研究[J]. 周莉莉,姜枫. 计算机应用研究. 2017(07)
硕士论文
[1]基于深度学习的单目图像深度估计[D]. 李耀宇.哈尔滨理工大学 2017
本文编号:3609367
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3609367.html