基于三元组的深度视频哈希方法研究
发布时间:2021-04-11 11:41
近年来随着互联网和通信技术的飞速发展,用户上传、下载互联网中的视频数据变得越来越便利。这不仅导致了互联网中的视频数据的急剧增长,也给视频数据的处理和存储带来了极大的挑战。如何在海量视频数据中精准的查找用户所需的视频内容,成为了近年来多媒体领域需要迫切解决的关键问题之一。哈希学习可以将复杂的原始数据映射成极短的哈希码,并在哈希码中保持原始数据间的相似性,通过哈希码在数据库中进行检索,既可以大幅度提高检索速度,又可以有效减少对存储空间的需求。因此,基于哈希学习实现图像和视频的检索,是近年来的一个研究热点。目前,哈希学习方法在图像检索中已有较多研究,取得了较大的进展,但在视频检索中的研究工作还比较有限,主要体现在哈希学习中对视频的时空特征编码不足,标签信息嵌入能力不强,且计算复杂度较高,这导致检索哈希检索性能与应用需求还有较大的差距。因此,本人选择基于哈希学习的视频检索作为研究课题,以进一步提升视频检索的性能。本论文研究了一种基于三元组的深度视频哈希检索方法,并对所提方法的性能进行了实验验证。主要研究工作概括如下:(1)基于卷积神经网络和长短时记忆网络,提出了一种端到端的有监督视频哈希编码网...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
图2-1?VGG网络结构??经最后一层池化后的特征图大小为7*7,输出特征张量的维度为7*7*512
??环神经网络与传统的全连接神经网络相比,其主要区别在于传统的神经网络通常??由输入到隐藏层再到输出,层与层之间为全连接的关系,而循环神经网络的每层??网络输出除了与当前的输入有关,也与之前序列的输出有关。这使得网络的隐藏??层并非独立于每一层网络中,而是互相连接贯穿整个输入序列,这种结构有利于??保存先前输入的序列信息。得益于循环输入的结构,循环神经网络非常适合序列??信息的处理,在自然语言处理与视频的相关场景中应用广泛。从理论上来讲,循??环神经网络可以处理任意长度的序列数据。图2-2是一个循环神经网络的结构示??意图,公式(2.1)(2.2)表示了该循环神经网络的前向传播过程。??6?°. ̄1?°t?°M??▲?A?A?n??v?v?v?v??个w个w个w??V?u?u?u??X?x,-l?Xt??图2-2循环神经网络的结构图??10??
?山东大学硕士学位论文???St=f(U-Xt?+?W-?5t_i)?(2.1)??0t?=?g(V-St)?(2.2)??上式中S为隐藏层状态,x为每一层网络的输入,〇为输出,t/、V、W为权重??矩阵,/(?)与扒?)为激活函数。??然而如图2-2所示的循环神经网络在实际应用中存在一些问题,如随着序列??的逐渐加深,序列先前部分的信息会随着网络传播逐渐减小,且越靠近初始部分,??信息损失就越大。此外,在网络的反向传播更新参数的过程中,隐藏层参数的连??乘会导致梯度消失从而导致无法更新参数的问题。基于这些问题,Hochreiter和??SchmidhuberfM等人提出了一种循环神经网络的变体,长短时记忆网络(Long??Short-Term?Memory)?0?????????^?t?/?t?/?t??-??—?-―?-??-1關—?—??-???a?^I3ZC?A?.??L?)?vj??J?v,?j??I?I?1??@?(xT)?Q??图2-3长短时记忆网络示意图??图2-3为长短时记忆网络的示意图。长短时记忆网络与传统循环神经网络的??主要区别在于细胞状态的加入。细胞状态是编码整个序列所有信息的一条信息??流,细胞状态通过遗忘门和输入门进行状态更新。每当由新的序列信息输入时,??遗忘门会计算之前的细胞状态中有哪些信息需要丢弃,有哪些信息需要保留,同??时输入门根据之前的输出和新的输入,计算哪些信息需要输入细胞状态,随后细??胞状态根据遗忘门和输入门的结果进行更新。输出门决定了细胞状态中的哪些信??息输出,将更新后的细胞状态中的信息输出并传递至下一时间步。下式(2
本文编号:3131190
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
图2-1?VGG网络结构??经最后一层池化后的特征图大小为7*7,输出特征张量的维度为7*7*512
??环神经网络与传统的全连接神经网络相比,其主要区别在于传统的神经网络通常??由输入到隐藏层再到输出,层与层之间为全连接的关系,而循环神经网络的每层??网络输出除了与当前的输入有关,也与之前序列的输出有关。这使得网络的隐藏??层并非独立于每一层网络中,而是互相连接贯穿整个输入序列,这种结构有利于??保存先前输入的序列信息。得益于循环输入的结构,循环神经网络非常适合序列??信息的处理,在自然语言处理与视频的相关场景中应用广泛。从理论上来讲,循??环神经网络可以处理任意长度的序列数据。图2-2是一个循环神经网络的结构示??意图,公式(2.1)(2.2)表示了该循环神经网络的前向传播过程。??6?°. ̄1?°t?°M??▲?A?A?n??v?v?v?v??个w个w个w??V?u?u?u??X?x,-l?Xt??图2-2循环神经网络的结构图??10??
?山东大学硕士学位论文???St=f(U-Xt?+?W-?5t_i)?(2.1)??0t?=?g(V-St)?(2.2)??上式中S为隐藏层状态,x为每一层网络的输入,〇为输出,t/、V、W为权重??矩阵,/(?)与扒?)为激活函数。??然而如图2-2所示的循环神经网络在实际应用中存在一些问题,如随着序列??的逐渐加深,序列先前部分的信息会随着网络传播逐渐减小,且越靠近初始部分,??信息损失就越大。此外,在网络的反向传播更新参数的过程中,隐藏层参数的连??乘会导致梯度消失从而导致无法更新参数的问题。基于这些问题,Hochreiter和??SchmidhuberfM等人提出了一种循环神经网络的变体,长短时记忆网络(Long??Short-Term?Memory)?0?????????^?t?/?t?/?t??-??—?-―?-??-1關—?—??-???a?^I3ZC?A?.??L?)?vj??J?v,?j??I?I?1??@?(xT)?Q??图2-3长短时记忆网络示意图??图2-3为长短时记忆网络的示意图。长短时记忆网络与传统循环神经网络的??主要区别在于细胞状态的加入。细胞状态是编码整个序列所有信息的一条信息??流,细胞状态通过遗忘门和输入门进行状态更新。每当由新的序列信息输入时,??遗忘门会计算之前的细胞状态中有哪些信息需要丢弃,有哪些信息需要保留,同??时输入门根据之前的输出和新的输入,计算哪些信息需要输入细胞状态,随后细??胞状态根据遗忘门和输入门的结果进行更新。输出门决定了细胞状态中的哪些信??息输出,将更新后的细胞状态中的信息输出并传递至下一时间步。下式(2
本文编号:3131190
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3131190.html