低成本视觉下的三维物体识别与位姿估计
发布时间:2020-12-21 07:12
位姿估计是指利用视觉等传感器获取的信息,从中估计目标物体与传感器之间的距离与姿态,该技术是机器人与环境交互、虚拟现实等应用的关键组成部分之一。传统计算机视觉方法中的特征提取算法所提取的特征信息往往不能满足任务的需求,深度学习在计算机视觉领域展现出的强大特征抽象与表达能力,为位姿估计问题提供了新的研究思路。另外深度相机、激光等传感器的发展与应用也给该问题提供了更加多样的手段,但是这些传感器对于物体材质、形状等有一定的要求,通常需要在结构化环境中使用。多目视觉往往存在安装困难、调试复杂。相比之下视觉传感器具有低廉的价格与较少的使用限制,同时易于推广和扩展到不同非结构化环境下的机器人平台上。考虑到基于传统方法的单目位姿估计方法难以克服非结构化环境中诸如复杂背景、遮挡等问题,本文在利用深度学习方法通过对目标物体进行识别,以获得目标物体的尺度等特征,进而估计出更精确的位姿信息,同时获得更强的鲁棒性和泛化能力。本文主要工作有:1)在深度神经网络的基础上设计了一个多任务的端到端位姿估计模型,该模型分为了目标检测与位姿估计两部分。在位姿估计部分设计使用了优化的损失函数,使得模型能直接估计物体的位姿,避...
【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图1.1双臂机器人对物体进行操作Figure1.1Two-armrobotoperatesonobjects.
Seeing3dchairs方法的输入图像与结果显示
DeepHeatmaps方法架构
本文编号:2929427
【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图1.1双臂机器人对物体进行操作Figure1.1Two-armrobotoperatesonobjects.
Seeing3dchairs方法的输入图像与结果显示
DeepHeatmaps方法架构
本文编号:2929427
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2929427.html