基于残差网络的多标签图像检索方法研究
发布时间:2021-06-28 11:07
随着人工智能,物联网以及多媒体等技术的快速发展,图像量级呈爆发式增长,如何高效准确地检索出用户所需图片是多标签图像检索领域面临的关键问题。为了提高多标签图像检索的准确率和效率,目前主流的解决方案为采用深度哈希的方法。尽管基于深度哈希的方法在多标签图像检索领域取得了一定的成果,然而在多标签图像检索时仍然存在检索准确率不高这一突出问题。本文围绕相关问题展开研究,提出了基于残差网络的多标签图像检索方法的解决方法,主要内容包含以下三个方面的工作:(1)在现有的深度网络模型中,提取的底层特征不能有效地将多标签图像的多层次语义信息和相似度排序信息集成到一个深度哈希模型中。因此,本文构建了基于改进残差网络的深度哈希模型。该模型采用成对多标签图像标签向量的余弦距离来量化多标签图像中存在的多层次相似性信息。同时,引入残差网络提高模型的学习能力。实验表明,与对比方法中最佳的基准模型相比,改进后的模型在两个多标签数据集上平均检索精度分别提高了4.09%和8.47%。(2)在现有的深度哈希模型中,提取的特征向量通常包含多标签图像的全局信息,其中包括多标签图像的目标信息和杂乱的背景信息。因此,本文构建了融合注意...
【文章来源】:桂林电子科技大学广西壮族自治区
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
人脑视觉机制示意图
基于残差网络的多标签图像检索方法研究(2) 人工神经网络人工神经网络(Artificial Neural Networks, ANN)是由动物大脑的生物神经网形成的计算系统[33]。大量的人工神经元构成神经网络,在大多数情况下,网络能在外界输入信号刺激下改变其网络参数,主动学习适应外界的变化为构成人工神经网络的基本单位[34]。如图 2-2 所示,人工神经元由四部分为输入刺激信号、求和计算单元、阈值和对求和结果进行激活的激活函数
第二章 研究相关的理论和技术1( )0f 和型:该激活函数是一种伪线性激活函数,其,当输出增加到某个值之后就会达到饱和状态图 2-4 所示。活函数:该函数作用也为将非线性元素添加到该神经元被激活产生一个响应;在某个输入范形图如图 2-5 所示,公式为 2-3 所示:
【参考文献】:
期刊论文
[1]深度学习研究综述[J]. 张荣,李伟平,莫同. 信息与控制. 2018(04)
[2]目标提取与哈希机制的多标签图像检索[J]. 陈飞,吕绍和,李军,王晓东,窦勇. 中国图象图形学报. 2017 (02)
[3]深度文本匹配综述[J]. 庞亮,兰艳艳,徐君,郭嘉丰,万圣贤,程学旗. 计算机学报. 2017(04)
硕士论文
[1]基于卷积神经网络的自然场景中数字的识别[D]. 周成伟.南京邮电大学 2017
[2]基于图像自编码的神经网络特征学习研究及应用[D]. 恩擎.北京工业大学 2017
[3]深度人脸特征提取及识别的应用研究[D]. 陈冠豪.重庆大学 2017
[4]基于相关性分析的跨媒体检索[D]. 王述.中国科学院大学(中国科学院工程管理与信息技术学院) 2017
[5]基于卷积神经网络的手势识别[D]. 蔡娟.福建师范大学 2015
[6]图像哈希编码方法研究与应用[D]. 居振飞.南京大学 2015
本文编号:3254207
【文章来源】:桂林电子科技大学广西壮族自治区
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
人脑视觉机制示意图
基于残差网络的多标签图像检索方法研究(2) 人工神经网络人工神经网络(Artificial Neural Networks, ANN)是由动物大脑的生物神经网形成的计算系统[33]。大量的人工神经元构成神经网络,在大多数情况下,网络能在外界输入信号刺激下改变其网络参数,主动学习适应外界的变化为构成人工神经网络的基本单位[34]。如图 2-2 所示,人工神经元由四部分为输入刺激信号、求和计算单元、阈值和对求和结果进行激活的激活函数
第二章 研究相关的理论和技术1( )0f 和型:该激活函数是一种伪线性激活函数,其,当输出增加到某个值之后就会达到饱和状态图 2-4 所示。活函数:该函数作用也为将非线性元素添加到该神经元被激活产生一个响应;在某个输入范形图如图 2-5 所示,公式为 2-3 所示:
【参考文献】:
期刊论文
[1]深度学习研究综述[J]. 张荣,李伟平,莫同. 信息与控制. 2018(04)
[2]目标提取与哈希机制的多标签图像检索[J]. 陈飞,吕绍和,李军,王晓东,窦勇. 中国图象图形学报. 2017 (02)
[3]深度文本匹配综述[J]. 庞亮,兰艳艳,徐君,郭嘉丰,万圣贤,程学旗. 计算机学报. 2017(04)
硕士论文
[1]基于卷积神经网络的自然场景中数字的识别[D]. 周成伟.南京邮电大学 2017
[2]基于图像自编码的神经网络特征学习研究及应用[D]. 恩擎.北京工业大学 2017
[3]深度人脸特征提取及识别的应用研究[D]. 陈冠豪.重庆大学 2017
[4]基于相关性分析的跨媒体检索[D]. 王述.中国科学院大学(中国科学院工程管理与信息技术学院) 2017
[5]基于卷积神经网络的手势识别[D]. 蔡娟.福建师范大学 2015
[6]图像哈希编码方法研究与应用[D]. 居振飞.南京大学 2015
本文编号:3254207
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3254207.html