复杂场景下的多视角三维场景定位研究

发布时间:2021-02-21 02:26
  在人工智能飞速发展的时代,人们对智能机器人、自动驾驶、室内导航等服务的需求越来越多,研究者们对这些领域进行了深入研究。这些领域都有一个共同的基本问题——如何较为精确的对相机自身进行定位。CNN在相机自定位中有较好的表现,但是依然存在精度低、错误率高的问题。其中一个重要原因是对位置、角度这两类不同参量的统一化处理。为了提升现有三维场景定位算法的定位精度,本文提出了两种基于深度学习的端到端的方法从单张彩色图像中恢复相机的位置和姿态。本文主要工作及创新之处总结如下:(1)提出一种双路编解码场景定位网络(DSEDL-Net),双路结构的设计解耦了位置与角度,解决了两者之间的串扰问题。由于相机位置和姿态的特性不同,该网络使用多任务思想将位置和姿态使用双路结构分别进行预测,从而得到更可靠的结果。提出使用单尺度降采样模块和多尺度聚合模块的位姿预测器对解码后的特征进行转换,配合使用全局均值池化操作捕捉特征的空间信息,起到减少信息损失的作用。(2)提出一种基于联合任务学习的场景定位网络(JTL-Loc Net)。DSEDL-Net解耦了位置与角度,但两者并不是完全孤立的,因此JTL-Loc Net引入注... 

【文章来源】:北方工业大学北京市

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

复杂场景下的多视角三维场景定位研究


世界坐标系到相机坐标系的转换

坐标系,相机,图像,像素


第二章多视角三维场景定位原理7图2-2相机坐标系与图像坐标系的转换图像坐标系的原点对应相机坐标系的光心。f表示焦距,由相似三角形的关系可得如下转换公式:000000100101CCCCXxfYZyfZ式(2-3)2.1.3图像坐标系到像素坐标系图像坐标系以像平面和照相机的光轴交点处作为坐标系原点,而像素坐标系的原点则在整幅图像的左上角。两种坐标系的量纲也不同,在图像坐标系中表示距离使用物理单位毫米,而在像素坐标系中表示距离则使用显示单位像素。这二者之间的转换如式2-4所示,其中dx和dy分别表示一列和一行代表多少毫米,即1像素=dx毫米。两个坐标系关系如图2-3所示。图2-3图像坐标系和像素坐标系关系

像素图,坐标系,像素,图像


第二章多视角三维场景定位原理7图2-2相机坐标系与图像坐标系的转换图像坐标系的原点对应相机坐标系的光心。f表示焦距,由相似三角形的关系可得如下转换公式:000000100101CCCCXxfYZyfZ式(2-3)2.1.3图像坐标系到像素坐标系图像坐标系以像平面和照相机的光轴交点处作为坐标系原点,而像素坐标系的原点则在整幅图像的左上角。两种坐标系的量纲也不同,在图像坐标系中表示距离使用物理单位毫米,而在像素坐标系中表示距离则使用显示单位像素。这二者之间的转换如式2-4所示,其中dx和dy分别表示一列和一行代表多少毫米,即1像素=dx毫米。两个坐标系关系如图2-3所示。图2-3图像坐标系和像素坐标系关系


本文编号:3043708

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3043708.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3b554***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com