面向大规模异构数据的哈希表征学习研究

发布时间:2018-07-11 18:47

  本文选题:哈希表征 + 异构数据 ; 参考:《清华大学》2016年博士论文


【摘要】:随着异构数据的快速增长,异构数据间的检索出现效率瓶颈。本文提出引入哈希这种简单的表征形式来加速异构数据间的检索。然而,传统哈希方法无法对异构数据的异构性建模,因此,无法应用于异构数据检索。本文针对异构数据的三个异构性(包括数据特征的异构性,数据对象的异构性以及数据网络的异构性)提出了相应的哈希学习框架,从而实现了异构数据上高效而精准的相似检索。本文的主要贡献如下:1.提出面向异构特征的哈希学习:针对属性特征高维稀疏及二值的特性和内容特征连续低维稠密的特性,本文提出了两个定制的概率生成模型分别对两种不同的特征建模,从而,充分地融合了两种特征的信息,使得哈希方法的精度得到显著提升。2.提出面向异构对象的哈希学习:本文提出了基于关联的异构哈希方法(Ra HH),实现了跨数据域的高效相似检索。Ra HH将不同数据域分别映射到不同的汉明空间,并基于异构关联关系学习汉明空间之间的映射。从而既保持了不同数据域的特性,又实现了跨数据域的检索。3.提出面向异构网络的哈希学习:本文主要关注关系不可传递的网络和有向网络。本文分别提出了基于相似成份的哈希学习方法及保持高阶相似度的哈希学习方法,对两种网络进行了合理建模,从而实现了异构网络数据上的高效相似检索。
[Abstract]:With the rapid growth of heterogeneous data, the efficiency of heterogeneous data retrieval appears bottleneck. In this paper, a simple representation of hash is proposed to accelerate the retrieval of heterogeneous data. However, the traditional hash method can not model the heterogeneity of heterogeneous data, so it can not be applied to heterogeneous data retrieval. In this paper, a hashing learning framework is proposed for the three heterogeneity of heterogeneous data (including the heterogeneity of data characteristics, the heterogeneity of data objects and the heterogeneity of data networks). Thus, the efficient and accurate similarity retrieval on heterogeneous data is realized. The main contributions of this paper are as follows: 1. Aiming at the high dimensional sparse and binary characteristics of attribute features and the continuous low dimensional dense characteristics of content features, two customized probability generation models are proposed to model the two different features respectively. The accuracy of the hashing method is greatly improved by fully integrating the information of the two features. A heterogeneous object oriented hash learning is proposed. In this paper, an association-based heterogeneous hash method (Ra HH) is proposed, which implements the efficient similarity retrieval across data domains. Ra HH maps different data domains to different hamming spaces. And learning the mapping between the Han Ming space based on the heterogeneous association relationship. Thus, it not only maintains the characteristics of different data domains, but also realizes the retrieval of. 3. 3 across data domains. Hashing learning for heterogeneous networks is proposed: this paper focuses on networks with intransisible relationships and directed networks. In this paper, hashing learning method based on similarity component and hashing learning method based on maintaining high order similarity are proposed, and two kinds of networks are modeled reasonably, so as to realize efficient similarity retrieval on heterogeneous network data.
【学位授予单位】:清华大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 赵琳;黄玉文;;异构数据交换的理论研究[J];科技信息;2010年21期

2 张琦,吴敏,黎干;基于XML Web Service的分布式异构数据透明转换机制[J];电脑与信息技术;2004年04期

3 刘扬,赵文吉,宫辉力;关于异构数据连接的研究[J];首都师范大学学报(自然科学版);2005年01期

4 邹晓玉;;一种异构数据的解决方案[J];台声.新视角;2006年01期

5 尹国标;楼勇亮;;异构数据如何“手拉手”[J];信息系统工程;2008年01期

6 刁兴春;严浩;丁鲲;;异构数据转换关键技术的实现[J];计算机工程;2008年17期

7 梁艳;胡先智;;异构数据转换系统设计与实现[J];信息与电脑(理论版);2011年08期

8 詹国华;何炎雯;李志华;;智能健康管理多源异构数据融合体系与方法[J];计算机应用与软件;2012年09期

9 唐钰;陈浩;叶柏龙;;基于逆向清理的实时异构数据整合模型研究[J];计算机工程;2012年23期

10 梁合功;;异构数据迁移系统设计与实现[J];科技致富向导;2013年23期

相关会议论文 前6条

1 姚燕;李湘;郭萍;郑波;;基于中间件的异构数据检索服务[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年

2 伍尚杰;陈立定;曾明;;基于XML异构数据的组态软件[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年

3 李刚;高春阳;崔明;;高校异构数据整合平台建设研究[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年

4 江涛;刘东波;刘巍;;基于XML的异构数据集成中间件研究[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年

5 周翔;翁剑成;荣建;;基于MDA的异构交通数据管理平台的研究与开发[A];2007第三届中国智能交通年会论文集[C];2007年

6 陈亚洲;齐从谦;甘屹;;基于Web的CAM异构数据转换和传输的研究[A];制造业与未来中国——2002年中国机械工程学会年会论文集[C];2002年

相关重要报纸文章 前2条

1 汪蔚;跨平台异构数据对接是选型根本[N];中国计算机报;2004年

2 西岸;Network Appliance发布新异构数据保护方案[N];通信产业报;2003年

相关博士学位论文 前4条

1 吴红星;面向多业态集团企业多源异构数据的协同系统集成方法研究[D];合肥工业大学;2015年

2 欧明栋;面向大规模异构数据的哈希表征学习研究[D];清华大学;2016年

3 于宝琴;成套电器企业异构数据整合及其物流系统的研究[D];天津大学;2006年

4 缪嘉嘉;异构数据映射技术研究[D];国防科学技术大学;2008年

相关硕士学位论文 前10条

1 高姣姣;MUSER异构数据采集及融合技术研究[D];昆明理工大学;2015年

2 高湛;基于混支持度和粗糙集的异构数据融合研究[D];燕山大学;2015年

3 郑文明;基于XML的异构数据交换在汽车零部件产业价值链协同云服务平台的研究与应用[D];西南交通大学;2015年

4 陈毅飞;基于多源异构数据的杨凌水肥信息管理系统研究[D];西北农林科技大学;2015年

5 叶茂伟;大规模异构数据即时整合系统的研究与实现[D];浙江大学;2016年

6 荆志;海量异构数据定制平台的设计与实现[D];河北师范大学;2013年

7 朱峰;基于JSON的互联网异构数据整合的应用研究[D];南京邮电大学;2016年

8 李瀚晨;基于“用户—景点”关系建模的景点推荐技术的研究[D];北京工业大学;2016年

9 徐凯;智慧高速海量异构数据处理关键技术研究[D];重庆交通大学;2016年

10 徐若涛;舰船维护中异构数据融合系统的设计与实现[D];华中科技大学;2016年



本文编号:2116272

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2116272.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户40389***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com