基于r-clique的不确定RDF关键字查询研究
[Abstract]:Resource description Framework (Resource Description Framework,) is a basic markup language used in semantic Web nets, which is widely used in many fields. Due to the existing ontology extraction, labeling methods and measurement techniques, there are errors and noises, which make uncertain RDF data widely exist. In recent years, query for uncertain RDF data has become a hot topic. Because uncertain RDF data can be modeled as an uncertain RDF graph, the research on keyword query of uncertain RDF data is actually a study of keyword query on an uncertain RDF graph. Based on the previous research, this paper proposes two algorithms of uncertain RDF keyword query based on r-clique-SABR and Habr. The Chinese meaning of the word "clique" is "maximum mass, subgroup", which refers to a subgraph in an uncertain graph. The letter r is a variable representing the threshold of distance. Therefore, r-clique is a subgraph of any two nodes containing all query keys whose distance is not greater than a given value r. In order to improve the query speed, an approximate algorithm of polynomial delay is proposed to construct r-clique. The algorithm KSABR (Keyword Search Algorithm Based on r-clique maps the keyword query problem on uncertain RDF data to the problem of finding r-cliques on uncertain graphs. In order to improve the quality of query results, a more accurate algorithm called: Habr (Efficient Algorithm Based on r-clique is proposed on the basis of KSABR. In HABR, a scoring function is used to sort the results. For the obtained k results top-k algorithm calls the scoring function to sort the results and then returns the top-k results to the user. In order to further improve the query speed, this paper designs two index structures, Ki (Keyword Inverted Index) and PI (Probabilistic Inverted Index). Ki, which store the mapping relationship between keywords and nodes. It can be used to implement structural pruning and probabilistic pruning. Pi can store the mapping relationship between key nodes and r-clique, and it can be used to implement scoring functions. Experiments show that the proposed algorithm KSABR has better performance in time performance and HABR has better performance in both time performance and result quality.
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 王焕景;李明;;“关键字查询”教学设计[J];中国教育技术装备;2007年12期
2 宋玉玲;王宁;;利用实体语义信息的关键字查询结果多样化[J];计算机科学与探索;2014年03期
3 陈子军;周同;刘文远;;面向集合和方向的空间关键字查询[J];小型微型计算机系统;2014年05期
4 任建华;周建;孟祥福;魏珂;;基于关键字之间结构关系的XML查询结果排序方法[J];计算机科学;2013年06期
5 黄静;陆嘉恒;孟小峰;;高效的XML关键字查询改写和结果生成技术[J];计算机研究与发展;2010年05期
6 王金宝;高宏;李建中;杨东华;;RB树:一种支持空间近似关键字查询的外存索引[J];计算机研究与发展;2012年10期
7 周军锋;孟小峰;;XML关键字查询处理研究[J];计算机学报;2012年12期
8 吴海涛;;一种改进的XML关键字查询算法[J];南京工程学院学报(自然科学版);2011年02期
9 李艳红;李国徽;张聪;;路网中空间关键字连续k近邻查询算法研究[J];华中科技大学学报(自然科学版);2013年12期
10 刘琰;周理;;基于VLCA的关键字查询匹配算法[J];科学技术与工程;2008年02期
相关会议论文 前5条
1 谢涛;王晓玲;欧阳树生;周傲英;;XML关键字检索的最低公共祖先快速查找方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 黄静;陆嘉恒;孟小峰;;高效的XML关键字查询改写和结果生成技术[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 方非;朱皓;杨卫东;;基于结构摘要的XML关键字检索[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 黄静;徐俊劲;周军锋;孟小峰;;MLCEA:一种基于实体的XML关键字查询语义[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 王小锋;张新;谢敏;孟小峰;周军锋;;XML数据流上的关键字查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
相关博士学位论文 前1条
1 张晨静;XML关键字过滤技术[D];复旦大学;2011年
相关硕士学位论文 前10条
1 张丹婷;基于事前约束的XML关键字查询处理研究[D];燕山大学;2015年
2 徐超;基于路网关键字的选择性估算研究[D];安徽工业大学;2015年
3 林健;云环境下支持隐私保护的动态模糊多关键字排列查询方法研究[D];东北大学;2014年
4 张舒;基于r-clique的不确定RDF关键字查询研究[D];东北大学;2014年
5 李赫;个人数据空间管理系统关键字查询的研究与实现[D];北京交通大学;2012年
6 周月;关键字查询性能优化研究[D];天津大学;2012年
7 付颜胜;面向集合的空间关键字查询方法研究[D];燕山大学;2012年
8 潘瑾琨;面向互联网位置服务的空间关键字查询技术研究与实现[D];国防科学技术大学;2012年
9 陈坤杰;带关键字的聚集路径查询技术研究[D];复旦大学;2013年
10 贺腾;面向XML关键字查询的用户查询意图推断问题研究[D];燕山大学;2014年
,本文编号:2154799
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2154799.html