基于深度学习的视觉地点识别技术研究
发布时间:2022-05-08 10:05
当前,视觉地点识别在多种新兴科技领域中拥有重要的应用前景和科研价值,并成为模式识别中的热点话题。对于视觉地点识别而言,提升性能的一个关键问题是设计分辨能力更强同时对各种视觉变换更鲁棒的图像特征表示方法,然而囿于地点的复杂性和多样性以及其面向的繁多的应用背景,现存的方法并不能完全满足当下的现实需求,还亟待进一步的研究和探索。本文基于深度学习方法对两种视觉地点识别中的难点问题展开了探讨和研究,主要完成的工作如下:在广泛阅读了国内外视觉地点识别及相关领域文献的基础上,对本文关注的两种视觉地点识别任务——视觉闭环检测、跨视角(Cross-View)图像地点识别系统中的现有方法进行了综述,并探讨和总结了现有方法取得的重要成果以及有待进一步探究的方向,为提出本文中的创新性方法奠定基础。针对视觉闭环检测任务,本文提出一种基于Squeeze-and-Excitation增强结构与并行多路径汇聚补偿策略的CNN模型(Hybrid-CNN)用于获取改进的CNN特征图;同时设计了一种基于沿通道降采样和非重叠池化的CNN特征图降维策略以加速特征相似度比对。利用经典的残差网络作为基模型,对“瓶颈”残差构建块应用...
【文章页数】:117 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 视觉地点识别应用介绍
1.2.2 视觉地点识别难点分析
1.2.3 视觉地点识别的常见方法
1.2.4 视觉地点识别的关键问题
1.3 论文主要工作和结构安排
1.3.1 本文的主要工作
1.3.2 本文结构安排
第二章 视觉地点识别相关基础及概念介绍
2.1 视觉地点识别中的手工特征与图像表示
2.1.1 手工局部特征介绍
2.1.2 BoW模型与局部特征聚类
2.1.3 手工全局特征介绍
2.1.4 手工特征融合
2.2 基于卷积神经网络特征的图像表示
2.2.1 卷积神经网络的基本单元
2.2.2 损失函数
2.2.3 参数优化方法
2.3 本章小结
第三章 基于Hybrid-CNN模型的视觉闭环检测
3.1 Hybrid-CNN特征提取器模型
3.1.1 基模型介绍
3.1.2 并行多路径汇聚补偿策略
3.1.3 特征通道关注机制——Squeeze-and-Excitation
3.2 基于沿通道降采样与非重叠池化的CNN特征图降维策略
3.3 实验与分析
3.3.1 视觉闭环检测相关数据集介绍
3.3.2 用于模型训练的场景图像数据集介绍
3.3.3 实验设备与平台
3.3.4 模型训练设置
3.3.5 特征的距离度量
3.3.6 闭环检测的评价度量
3.3.7 方法步骤
3.3.8 闭环检测实验结果与分析
3.4 本章小结
第四章 一种融入特征信息上下文关注机制的CNN模型设计
4.1 多尺度特征上下文关注模块——Mul-FCAM设计
4.1.1 特征通道关注子模块实现
4.1.2 空间信息关注子模块实现
4.2 融合特征上下文关注模块的CNN模型——Res FCAMNet
4.3 实验与分析
4.3.1 实验设备与平台
4.3.2 实验结果
4.4 本章小结
第五章 基于Siam-FCAMNet与困难样本挖掘的跨视角图像地点识别
5.1 跨视角图像地点识别中的孪生网络模型介绍
5.2 CNN特征向量获取
5.3 一种基于样本赋权实现在线困难数据挖掘的Triplet损失函数设计
5.3.1 Exhaustive Mini Batch策略
5.3.2 基于距离修正Logistic回归与香农自信息的样本赋权
5.3.3 方向回归网络分支与辅助损失
5.4 实验与分析
5.4.1 跨视角图像地点识别相关数据集介绍
5.4.2 模型与训练设置细节
5.4.3 跨视角图像地点识别的评价度量
5.4.4 本文方法与现有方法的比较
5.4.5 本文损失函数与Triplet EDBL损失函数的性能对比
5.4.6 多样本平均策略性能实验
5.5 本章小结
第六章 总结与展望
6.1 本文的主要工作
6.2 下一步工作展望
致谢
参考文献
作者在学期间取得的学术成果
【参考文献】:
期刊论文
[1]CNN Feature Boosted SeqSLAM for Real-Time Loop Closure Detection[J]. BAI Dongdong,WANG Chaoqun,ZHANG Bo,YI Xiaodong,YANG Xuejun. Chinese Journal of Electronics. 2018(03)
[2]基于精简卷积神经网络的快速闭环检测方法[J]. 何元烈,陈佳腾,曾碧. 计算机工程. 2018(06)
博士论文
[1]基于关注度机制的图像理解[D]. 郭聪.中国科学技术大学 2018
[2]深度学习下细粒度级别图像的视觉分析研究[D]. 魏秀参.南京大学 2018
[3]基于深度卷积神经网络的图像分类方法研究及应用[D]. 高震宇.中国科学技术大学 2018
[4]基于深度学习表征的图像检索技术[D]. 孙韶言.中国科学技术大学 2017
[5]基于局部特征提取的人脸识别方法研究[D]. 李文娟.天津大学 2017
[6]基于图像学习表征和重排序的遥感影像内容检索[D]. 唐旭.西安电子科技大学 2017
[7]基于卷积神经网络的计算机视觉关键技术研究[D]. 李彦冬.电子科技大学 2017
[8]基于深层神经网络的图像识别算法研究[D]. 连自锋.北京邮电大学 2017
[9]基于迁移学习与深度卷积特征的图像标注方法研究[D]. 宋光慧.浙江大学 2017
硕士论文
[1]基于卷积神经网络的图像识别[D]. 蒋帅.吉林大学 2017
[2]基于深度学习的无人驾驶场景识别[D]. 韩昕辉.中山大学 2017
[3]基于深度学习的目标场景识别[D]. 刘宇轩.北京邮电大学 2017
本文编号:3651452
【文章页数】:117 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 视觉地点识别应用介绍
1.2.2 视觉地点识别难点分析
1.2.3 视觉地点识别的常见方法
1.2.4 视觉地点识别的关键问题
1.3 论文主要工作和结构安排
1.3.1 本文的主要工作
1.3.2 本文结构安排
第二章 视觉地点识别相关基础及概念介绍
2.1 视觉地点识别中的手工特征与图像表示
2.1.1 手工局部特征介绍
2.1.2 BoW模型与局部特征聚类
2.1.3 手工全局特征介绍
2.1.4 手工特征融合
2.2 基于卷积神经网络特征的图像表示
2.2.1 卷积神经网络的基本单元
2.2.2 损失函数
2.2.3 参数优化方法
2.3 本章小结
第三章 基于Hybrid-CNN模型的视觉闭环检测
3.1 Hybrid-CNN特征提取器模型
3.1.1 基模型介绍
3.1.2 并行多路径汇聚补偿策略
3.1.3 特征通道关注机制——Squeeze-and-Excitation
3.2 基于沿通道降采样与非重叠池化的CNN特征图降维策略
3.3 实验与分析
3.3.1 视觉闭环检测相关数据集介绍
3.3.2 用于模型训练的场景图像数据集介绍
3.3.3 实验设备与平台
3.3.4 模型训练设置
3.3.5 特征的距离度量
3.3.6 闭环检测的评价度量
3.3.7 方法步骤
3.3.8 闭环检测实验结果与分析
3.4 本章小结
第四章 一种融入特征信息上下文关注机制的CNN模型设计
4.1 多尺度特征上下文关注模块——Mul-FCAM设计
4.1.1 特征通道关注子模块实现
4.1.2 空间信息关注子模块实现
4.2 融合特征上下文关注模块的CNN模型——Res FCAMNet
4.3 实验与分析
4.3.1 实验设备与平台
4.3.2 实验结果
4.4 本章小结
第五章 基于Siam-FCAMNet与困难样本挖掘的跨视角图像地点识别
5.1 跨视角图像地点识别中的孪生网络模型介绍
5.2 CNN特征向量获取
5.3 一种基于样本赋权实现在线困难数据挖掘的Triplet损失函数设计
5.3.1 Exhaustive Mini Batch策略
5.3.2 基于距离修正Logistic回归与香农自信息的样本赋权
5.3.3 方向回归网络分支与辅助损失
5.4 实验与分析
5.4.1 跨视角图像地点识别相关数据集介绍
5.4.2 模型与训练设置细节
5.4.3 跨视角图像地点识别的评价度量
5.4.4 本文方法与现有方法的比较
5.4.5 本文损失函数与Triplet EDBL损失函数的性能对比
5.4.6 多样本平均策略性能实验
5.5 本章小结
第六章 总结与展望
6.1 本文的主要工作
6.2 下一步工作展望
致谢
参考文献
作者在学期间取得的学术成果
【参考文献】:
期刊论文
[1]CNN Feature Boosted SeqSLAM for Real-Time Loop Closure Detection[J]. BAI Dongdong,WANG Chaoqun,ZHANG Bo,YI Xiaodong,YANG Xuejun. Chinese Journal of Electronics. 2018(03)
[2]基于精简卷积神经网络的快速闭环检测方法[J]. 何元烈,陈佳腾,曾碧. 计算机工程. 2018(06)
博士论文
[1]基于关注度机制的图像理解[D]. 郭聪.中国科学技术大学 2018
[2]深度学习下细粒度级别图像的视觉分析研究[D]. 魏秀参.南京大学 2018
[3]基于深度卷积神经网络的图像分类方法研究及应用[D]. 高震宇.中国科学技术大学 2018
[4]基于深度学习表征的图像检索技术[D]. 孙韶言.中国科学技术大学 2017
[5]基于局部特征提取的人脸识别方法研究[D]. 李文娟.天津大学 2017
[6]基于图像学习表征和重排序的遥感影像内容检索[D]. 唐旭.西安电子科技大学 2017
[7]基于卷积神经网络的计算机视觉关键技术研究[D]. 李彦冬.电子科技大学 2017
[8]基于深层神经网络的图像识别算法研究[D]. 连自锋.北京邮电大学 2017
[9]基于迁移学习与深度卷积特征的图像标注方法研究[D]. 宋光慧.浙江大学 2017
硕士论文
[1]基于卷积神经网络的图像识别[D]. 蒋帅.吉林大学 2017
[2]基于深度学习的无人驾驶场景识别[D]. 韩昕辉.中山大学 2017
[3]基于深度学习的目标场景识别[D]. 刘宇轩.北京邮电大学 2017
本文编号:3651452
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3651452.html