面向多示例数据检索的哈希方法研究
本文关键词:面向多示例数据检索的哈希方法研究 出处:《山东大学》2016年硕士论文 论文类型:学位论文
【摘要】:近年来,随着互联网的普及和移动互联网的快速发展,互联网上的数据量呈指数式增长而且数据的类型日益增多。面对海量的数据,如何进行快速的相似性检索,吸引了众多学者的广泛研究。随着机器学习技术的空前发展,越来越多的人开始使用其解决现实中的复杂问题,因此,我们也利用机器学习方法来解决海量数据的快速检索问题。多示例学习被广泛应用于场景分类等多媒体网络问题。相比于单示例,多示例数据能更自然、更好地描述样本,但同时也使得多示例数据集的变得非常庞大。在许多场景下,用户需要对多示例数据集进行检索,然而,传统的核函数方法在原始空间上计算包之间的相似性,由于计算时间长,需要的存储空间大,很难将其应用到大规模多示例数据集上。最近,哈希学习算法由于其优越的计算和存储性能,受到了学者们的广泛关注。哈希学习主要通过保持数据的相似性信息,将原始空间的数据映射到低维的海明空间,得到紧致的二进制哈希码。通过计算海明距离,能够快速地返回相似性结果;同时,对于大规模数据,只需要存储最终紧致的哈希码,使得所需存储空间也大大降低。因此,哈希学习方法由于其很好的时空特性,可以完美地解决以上难题。本文研究的主要问题是如何将哈希学习应用到多示例数据检索上。从包和示例两个层面考虑,我们提出了两种多示例数据集上的哈希方法:1)包层面的多示例哈希方法。首先,对示例空间的所有示例进行聚类操作,生成一系列的聚簇中心:然后,利用本文提出的特征融合方式,将所有包转化成一个新的特征表示;最后,采用监督哈希方法将得到的特征转向量化为二进制哈希码。2)示例层面的多示例哈希方法。为了使用更多的示例信息,我们考虑可以直接应用无监督或有监督哈希算法将每个包中的所有示例转化成哈希码,对于一个查询包,提出了种根据示例哈希码计算包之间的相似性的度量。很多研究表明,在哈希学习中加入监督标记,会增强哈希函数的表现能力。在多示例数据中,由于负包中不含有任何正示例,将负包中的所有示例标记为负;另一方面,由于正包中正示例标记未知,将其中的所有示例视为无标记。根据以上描述,可以将多示例哈希学习看作一种半监督学习方式。在上述方法中,只应用到了负包的标记,而没有使用正包的标记信息。因此,本文进一步采用示例选择的方式,开发正包中的正示例标记,并将其应用到哈希函数的学习当中。我们将上面提到的两种方法在公开的数据集进行对比,实验表明嵌入监督信息的示例层面的多示例哈希方法能取得更好地效果。同时,我们也于传统的核函数方法进行了比较,结果表明,多示例哈希在准确率相差不大的情况下,大大提高了检索的速度。
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【相似文献】
相关期刊论文 前10条
1 邹建成;周红丽;邓欢军;;一种安全鲁棒的图像哈希方法[J];计算机应用研究;2009年06期
2 张维克;孔祥维;尤新刚;;安全鲁棒的图像感知哈希技术[J];东南大学学报(自然科学版);2007年S1期
3 牛夏牧;焦玉华;;感知哈希综述[J];电子学报;2008年07期
4 徐泽明;侯紫峰;;串的快速连续弱哈希及其应用[J];软件学报;2011年03期
5 刘丽;李晓举;李玲玲;;视频哈希的性能分析与测试[J];计算机工程;2012年06期
6 鲍爱华;袁晓萍;陈锋;刘鹏;;基于哈希树的分布式目录同步方法[J];解放军理工大学学报(自然科学版);2013年06期
7 徐剑;陈旭;李福祥;周福才;;基于有向哈希树的认证跳表算法[J];计算机科学;2011年09期
8 周国强;田先桃;张卫丰;张迎周;;基于图像感知哈希技术的钓鱼网页检测[J];南京邮电大学学报(自然科学版);2012年04期
9 吴鹤龄;;动态哈希文件的实现技术[J];计算机研究与发展;1990年03期
10 大卫·塔尔波特;;哈希缓存[J];科技创业;2009年07期
相关会议论文 前5条
1 张维克;孔祥维;尤新刚;;安全鲁棒的图像感知哈希技术[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
2 夏斌;王斌;关志峰;;一种基于多维哈希链的M-Commerce微支付方案[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
3 尚凤军;潘英俊;;一种双哈希IP数据包分类算法研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 吴万烽;王汝传;黄海平;孙力娟;;Sead协议哈希链机制的分析与改进[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年
5 蒋惠萍;杨晨雨;袁杰;;基于深空网络化感知系统抗功耗快速哈希验证方法研究[A];中国宇航学会深空探测技术专业委员会第五届学术年会论文集[C];2008年
相关博士学位论文 前3条
1 李金凤;基于感知哈希及数字水印的音频认证技术研究[D];西南交通大学;2015年
2 张慧;图像感知哈希测评基准及算法研究[D];哈尔滨工业大学;2009年
3 刘兆庆;图像感知哈希若干关键技术研究[D];哈尔滨工业大学;2013年
相关硕士学位论文 前10条
1 周新生;一种面向用户的无线局域网冗余消除机制[D];上海交通大学;2015年
2 汪胜圣;基于哈希的大规模多标签图像搜索方法研究[D];山东大学;2016年
3 梁小龙;关于拓扑保持的哈希方法研究[D];山东大学;2016年
4 杨W,
本文编号:1324669
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1324669.html