基于增强自编码器的室内物体目标检测与姿态估计
发布时间:2022-07-09 19:14
理解室内场景下物体的类别、位置及姿态是机器人抓取、虚拟现实和增强现实中的人机交互任务的关键先决条件。目前很多算法都是基于场景并不复杂、物体之间遮挡很少甚至没有遮挡、只能处理场景中的单个目标等,不过真实的姿态估计场景中,多为物体摆放杂乱无章、物体间存在被遮挡或自遮挡等复杂场景,所以复杂场景对于姿态估计算法的鲁棒性和泛化性仍然是具有挑战性的研究问题。本文围绕此问题从以下几个方面进行研究:1.对于室内物体间存在许多遮挡问题,本文改进堆栈式去噪自编码器,提出一种基于增强自编码器的室内遮挡目标图像重建方法。算法首先对输入的图像增加随机噪声(如高斯噪声、随机Mask遮挡等);然后将增加过噪声的图像输入给增强自编码器,经过编码、解码后,输出一个与原始图像相同维度的向量;最后将向量转换成与原始输入图像尺寸相同的图像,且此图像是不含遮挡的图像。从重建LINEMOD数据集的图像前后效果对比,表明增强自编码器在遮挡目标重建上是可行的方法,可以很容易与其他网络融合。2.对于很多算法无法处理复杂场景下多目标检测问题,首先改进原始LINEMOD单目标数据集为多目标数据集,然后使用本文改进后的Faster R-CN...
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
计算机视觉的研究成果从图1-1可以看出:图(a)是通过单目相机获取的驾驶员头部图像错误!未找到引用源
主要章节关系图
ILSVRC历年Top-5错误率,从ResNet开始已超过人类视觉的水平另外,深度学习更多是有监督学习,依赖于大量的数据,而对于图像数据在
【参考文献】:
期刊论文
[1]自编码神经网络理论及应用综述[J]. 袁非牛,章琳,史劲亭,夏雪,李钢. 计算机学报. 2019(01)
[2]基于自编码算法的深度学习综述[J]. 崔广新,李殿奎. 计算机系统应用. 2018(09)
[3]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
本文编号:3657665
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
计算机视觉的研究成果从图1-1可以看出:图(a)是通过单目相机获取的驾驶员头部图像错误!未找到引用源
主要章节关系图
ILSVRC历年Top-5错误率,从ResNet开始已超过人类视觉的水平另外,深度学习更多是有监督学习,依赖于大量的数据,而对于图像数据在
【参考文献】:
期刊论文
[1]自编码神经网络理论及应用综述[J]. 袁非牛,章琳,史劲亭,夏雪,李钢. 计算机学报. 2019(01)
[2]基于自编码算法的深度学习综述[J]. 崔广新,李殿奎. 计算机系统应用. 2018(09)
[3]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川. 数据采集与处理. 2016(01)
本文编号:3657665
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3657665.html
最近更新
教材专著