基于难例挖掘和域自适应的视觉位置识别
发布时间:2022-01-15 10:58
随着计算机视觉相关技术的不断发展,即时定位与地图构建(SLAM)技术在人类生活中的应用越来越广泛,如自主导航机器人、自动驾驶、无人机、虚拟现实等。但在SLAM中,我们依然面临着不少需要解决的难题,比如回环检测。回环检测的任务是判断当前位置是否为之前访问过的某个位置,目的是为构建地图任务添加新的约束,从而消去地图构建过程中产生的累计误差。回环检测的本质是位置识别。传统的位置识别算法如视觉词袋模型等依赖于手工设计的图像特征,这些特征在变化场景(场景中行人和车辆等可移动对象发生变化)、视点改变以及昼夜光照差异的情况下会发生改变,从而影响位置识别的性能。另一方面,近年来深度学习在计算机视觉领域取得了巨大的进步,其实现了特征表达与分类识别的联合学习,从而可以自动提取更加鲁棒的图像特征。为此有学者提出了基于深度卷积神经网络的视觉位置识别算法。本文研究也是围绕基于深度卷积神经网络的视觉位置识别展开的,与传统的算法相比可以解决在变化场景以及视角改变的情况下低识别率的问题。但是,已有的基于深度卷积神经网络的算法没有充分考虑到与待识别目标图像相似的负样本的干扰的问题。这些负样本为对于深度卷积神经网络而言难...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
视觉位置识别的基本框架
华 中 科 技 大 学 硕 士 学 位 论 文最后三层为全连接层。因为我们只利用 VGG16 提取图像特征,并且有学者已经证明神经网络的中层特征在位置识别任务中性能更好[30]。所以本文去掉了 VGG16 网络中的最后三层全连接层。VGG16 深度神经网络包含十三层卷积层,属于较深的神经网络,能够有效地提取到图像的丰富特征,去掉了其最后三层全连接层的结构如图 2-1 所示,其中第一大层卷积层 Conv1 包含两层卷积层,每一层卷积层之后包含一层激活层如图 2-1 中的灰色部分,激活函数使用线性整流函数(Relu),对深度神经网络中的神经元的活跃度进行调节,并且该激活函数可以有效避免深度神经网络在训练过程中出现梯度消失,使神经网络在训练过程中利用梯度下降最小化损失更加有效。
如果将 VLAD 算法看做硬 VLAD 算法,NetVLAD 算法则是基于深度神经 VLAD 算法。从式 2-1 中可以看出,每一个局部特征与离自己最近聚类中权重为1,与其他聚类中心的差的权重为 0。而在NetVLAD中的表达如下所j 1( ), (1, 2,... ), 1iInj ij i jFeat sif urejfea a f c j C a (ija 为第 i 个特征与第 j 个聚类中心的向量差的权重,第 i 个特征到所有聚向量差的权重和为 1。所以,我们可以看出 NetVLAD 为软 VLAD,向量差一个概率,该概率的大小与特征和聚类中心的距离有关。到最近的聚类中大,到最远的聚类中心的权重小,对于每一个特征向量,到所有聚类中心为 1。这样相比于 VLAD 算法,NetVLAD 算法用到了更多的聚类中心的D 算法中权重只为 1 和 0,只用了离自己最近的聚类中心的信息。特征聚etVALD 的网络结构如图 2-2 所示。
【参考文献】:
期刊论文
[1]基于卷积神经网络的视觉位置识别方法[J]. 仇晓松,邹旭东,王金戈,展扬. 计算机工程与设计. 2019(01)
[2]基于深度卷积神经网络的位置识别方法[J]. 黄于峰,刘建国. 计算机与数字工程. 2018(04)
本文编号:3590496
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
视觉位置识别的基本框架
华 中 科 技 大 学 硕 士 学 位 论 文最后三层为全连接层。因为我们只利用 VGG16 提取图像特征,并且有学者已经证明神经网络的中层特征在位置识别任务中性能更好[30]。所以本文去掉了 VGG16 网络中的最后三层全连接层。VGG16 深度神经网络包含十三层卷积层,属于较深的神经网络,能够有效地提取到图像的丰富特征,去掉了其最后三层全连接层的结构如图 2-1 所示,其中第一大层卷积层 Conv1 包含两层卷积层,每一层卷积层之后包含一层激活层如图 2-1 中的灰色部分,激活函数使用线性整流函数(Relu),对深度神经网络中的神经元的活跃度进行调节,并且该激活函数可以有效避免深度神经网络在训练过程中出现梯度消失,使神经网络在训练过程中利用梯度下降最小化损失更加有效。
如果将 VLAD 算法看做硬 VLAD 算法,NetVLAD 算法则是基于深度神经 VLAD 算法。从式 2-1 中可以看出,每一个局部特征与离自己最近聚类中权重为1,与其他聚类中心的差的权重为 0。而在NetVLAD中的表达如下所j 1( ), (1, 2,... ), 1iInj ij i jFeat sif urejfea a f c j C a (ija 为第 i 个特征与第 j 个聚类中心的向量差的权重,第 i 个特征到所有聚向量差的权重和为 1。所以,我们可以看出 NetVLAD 为软 VLAD,向量差一个概率,该概率的大小与特征和聚类中心的距离有关。到最近的聚类中大,到最远的聚类中心的权重小,对于每一个特征向量,到所有聚类中心为 1。这样相比于 VLAD 算法,NetVLAD 算法用到了更多的聚类中心的D 算法中权重只为 1 和 0,只用了离自己最近的聚类中心的信息。特征聚etVALD 的网络结构如图 2-2 所示。
【参考文献】:
期刊论文
[1]基于卷积神经网络的视觉位置识别方法[J]. 仇晓松,邹旭东,王金戈,展扬. 计算机工程与设计. 2019(01)
[2]基于深度卷积神经网络的位置识别方法[J]. 黄于峰,刘建国. 计算机与数字工程. 2018(04)
本文编号:3590496
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3590496.html
最近更新
教材专著