基于深度学习的大规模景点影像检索方法研究与应用
发布时间:2022-02-08 23:01
基于内容的旅游景点影像检索是智慧旅游领域内的一项基本任务。由于景点影像拍摄的季节、光照和角度等条件的不同,使其相较于其他基于内容的影像检索(Content-based image retrieval,CBIR)任务而言更加具有挑战性。哈希检索是一种主流的影像检索方法,其算法中使用的哈希编码在计算和存储上具有独特优势。然而传统的哈希算法存在特征表达能力差,编码冗余度高等缺点,导致其在景点影像检索任务中的表现不能令人满意。为了解决这个问题,本文使用一种基于深度学习的哈希码生成策略,可以端对端的训练哈希映射。并且针对现有深度哈希算法存在的不足,对现有算法进行了一些改进以提高训练的稳定性和检索的性能,从而实现在大规模的景点影像数据集上对景点影像进行高效且快速的检索。具体来说,本文主要包含以下几方面内容:第一:针对传统手工特征在特征表达能力和泛化能力上的局限性,本文使用一种高效的卷积神经网络作为特征提取子网络,用于提取具有更好表达能力的影像特征,并且使用迁移学习的方式迁移网络参数,从而进一步优化网络性能。第二:综合现有深度哈希检索算法中的优缺点,对现有方法进行改进。首先使用分块编码的方式代替传统...
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
深度学习基本结构
受限波兹曼机
可见层的条件概率分布, P ( h( l 1)| h( l ))是最高层的波兹曼机的联合概率分布。DNB 模型如图2.3 所示。从中可以比较清晰的看出,一个深度置信网络中包含多个受限波兹曼机。DBN模型除了输出层为无向图之外,其它层均为自上而下的有向图。通过多层之间的迭代循环计算,在最高层的可视化层,深度置信网络可以对数据充分的使用条件概率进行表达。
【参考文献】:
期刊论文
[1]基于深度卷积神经网络和二进制哈希学习的图像检索方法[J]. 彭天强,栗芳. 电子与信息学报. 2016(08)
硕士论文
[1]基于内容的图像检索算法研究[D]. 金铭.北京工业大学 2016
[2]大规模旅游景点图像检索[D]. 王星祥.安徽大学 2016
[3]高维数据的哈希索引技术研究[D]. 杨真真.北京交通大学 2015
本文编号:3615915
【文章来源】:重庆邮电大学重庆市
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
深度学习基本结构
受限波兹曼机
可见层的条件概率分布, P ( h( l 1)| h( l ))是最高层的波兹曼机的联合概率分布。DNB 模型如图2.3 所示。从中可以比较清晰的看出,一个深度置信网络中包含多个受限波兹曼机。DBN模型除了输出层为无向图之外,其它层均为自上而下的有向图。通过多层之间的迭代循环计算,在最高层的可视化层,深度置信网络可以对数据充分的使用条件概率进行表达。
【参考文献】:
期刊论文
[1]基于深度卷积神经网络和二进制哈希学习的图像检索方法[J]. 彭天强,栗芳. 电子与信息学报. 2016(08)
硕士论文
[1]基于内容的图像检索算法研究[D]. 金铭.北京工业大学 2016
[2]大规模旅游景点图像检索[D]. 王星祥.安徽大学 2016
[3]高维数据的哈希索引技术研究[D]. 杨真真.北京交通大学 2015
本文编号:3615915
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3615915.html