当前位置:主页 > 管理论文 > 移动网络论文 >

基于r-clique的不确定RDF关键字查询研究

发布时间:2018-07-31 06:59
【摘要】:资源描述框架(Resource Description Framework,简称RDF)是语义Web网所使用的基本标记语言,在诸多领域中有广泛应用。由于现有的本体抽取、标注方法和测量技术存在误差和噪声,使得不确定RDF数据普遍存在。近年来,对于不确定RDF数据的查询研究逐渐成为热点。由于不确定RDF数据可以建模为不确定RDF图,那么对于不确定RDF数据的关键字查询的研究实际上就是对于不确定图上关键字查询的研究。本文在已有研究的基础上,提出了两种基于r-clique的不确定RDF关键字查询的算法-——SABR和HABR。单词”clique"的中文释义是“极大团、子群体”,这里指不确定图中的子图,字母r是一个表示距离阈值的变量。所以,r-clique是指包含所有查询关键字的任意两个节点的距离不大于给定值r的子图。为了提高查询速度,本文提出了一种多项式时延的近似算法来构建r-clique。算法KSABR (Keyword Search Algorithm Based on r-clique)将不确定RDF数据上的关键字查询问题映射为寻找不确定图上的r-cliques的问题。为了提高查询结果的质量,在KSABR的基础上又进一步提出了精度更高的算法:HABR (Efficient Algorithm Based on r-clique)。 HABR中采用了打分函数对结果进行排序。对于得到的k个结果,HABR算法调用打分函数对结果进行排序,然后将top-k个结果返回给用户。为了进一步提高查询的速度,本文设计了两种索引结构——KI (Keyword Inverted Index)和PI (Probabilistic Inverted Index)。KI中存放的是关键字和节点之间的映射关系,它可以用来实现结构剪枝和概率剪枝。PI中存放的是关键字节点和r-clique之间的映射关系,它可以用来实现打分函数。实验证明,本论文提出的算法KSABR在时间性能上具有较好的性能,而算法HABR在时间性能和结果质量上都具有较好的性能。
[Abstract]:Resource description Framework (Resource Description Framework,) is a basic markup language used in semantic Web nets, which is widely used in many fields. Due to the existing ontology extraction, labeling methods and measurement techniques, there are errors and noises, which make uncertain RDF data widely exist. In recent years, query for uncertain RDF data has become a hot topic. Because uncertain RDF data can be modeled as an uncertain RDF graph, the research on keyword query of uncertain RDF data is actually a study of keyword query on an uncertain RDF graph. Based on the previous research, this paper proposes two algorithms of uncertain RDF keyword query based on r-clique-SABR and Habr. The Chinese meaning of the word "clique" is "maximum mass, subgroup", which refers to a subgraph in an uncertain graph. The letter r is a variable representing the threshold of distance. Therefore, r-clique is a subgraph of any two nodes containing all query keys whose distance is not greater than a given value r. In order to improve the query speed, an approximate algorithm of polynomial delay is proposed to construct r-clique. The algorithm KSABR (Keyword Search Algorithm Based on r-clique maps the keyword query problem on uncertain RDF data to the problem of finding r-cliques on uncertain graphs. In order to improve the quality of query results, a more accurate algorithm called: Habr (Efficient Algorithm Based on r-clique is proposed on the basis of KSABR. In HABR, a scoring function is used to sort the results. For the obtained k results top-k algorithm calls the scoring function to sort the results and then returns the top-k results to the user. In order to further improve the query speed, this paper designs two index structures, Ki (Keyword Inverted Index) and PI (Probabilistic Inverted Index). Ki, which store the mapping relationship between keywords and nodes. It can be used to implement structural pruning and probabilistic pruning. Pi can store the mapping relationship between key nodes and r-clique, and it can be used to implement scoring functions. Experiments show that the proposed algorithm KSABR has better performance in time performance and HABR has better performance in both time performance and result quality.
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09

【相似文献】

相关期刊论文 前10条

1 王焕景;李明;;“关键字查询”教学设计[J];中国教育技术装备;2007年12期

2 宋玉玲;王宁;;利用实体语义信息的关键字查询结果多样化[J];计算机科学与探索;2014年03期

3 陈子军;周同;刘文远;;面向集合和方向的空间关键字查询[J];小型微型计算机系统;2014年05期

4 任建华;周建;孟祥福;魏珂;;基于关键字之间结构关系的XML查询结果排序方法[J];计算机科学;2013年06期

5 黄静;陆嘉恒;孟小峰;;高效的XML关键字查询改写和结果生成技术[J];计算机研究与发展;2010年05期

6 王金宝;高宏;李建中;杨东华;;RB树:一种支持空间近似关键字查询的外存索引[J];计算机研究与发展;2012年10期

7 周军锋;孟小峰;;XML关键字查询处理研究[J];计算机学报;2012年12期

8 吴海涛;;一种改进的XML关键字查询算法[J];南京工程学院学报(自然科学版);2011年02期

9 李艳红;李国徽;张聪;;路网中空间关键字连续k近邻查询算法研究[J];华中科技大学学报(自然科学版);2013年12期

10 刘琰;周理;;基于VLCA的关键字查询匹配算法[J];科学技术与工程;2008年02期

相关会议论文 前5条

1 谢涛;王晓玲;欧阳树生;周傲英;;XML关键字检索的最低公共祖先快速查找方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

2 黄静;陆嘉恒;孟小峰;;高效的XML关键字查询改写和结果生成技术[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

3 方非;朱皓;杨卫东;;基于结构摘要的XML关键字检索[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

4 黄静;徐俊劲;周军锋;孟小峰;;MLCEA:一种基于实体的XML关键字查询语义[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

5 王小锋;张新;谢敏;孟小峰;周军锋;;XML数据流上的关键字查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

相关博士学位论文 前1条

1 张晨静;XML关键字过滤技术[D];复旦大学;2011年

相关硕士学位论文 前10条

1 张丹婷;基于事前约束的XML关键字查询处理研究[D];燕山大学;2015年

2 徐超;基于路网关键字的选择性估算研究[D];安徽工业大学;2015年

3 林健;云环境下支持隐私保护的动态模糊多关键字排列查询方法研究[D];东北大学;2014年

4 张舒;基于r-clique的不确定RDF关键字查询研究[D];东北大学;2014年

5 李赫;个人数据空间管理系统关键字查询的研究与实现[D];北京交通大学;2012年

6 周月;关键字查询性能优化研究[D];天津大学;2012年

7 付颜胜;面向集合的空间关键字查询方法研究[D];燕山大学;2012年

8 潘瑾琨;面向互联网位置服务的空间关键字查询技术研究与实现[D];国防科学技术大学;2012年

9 陈坤杰;带关键字的聚集路径查询技术研究[D];复旦大学;2013年

10 贺腾;面向XML关键字查询的用户查询意图推断问题研究[D];燕山大学;2014年



本文编号:2154799

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2154799.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4304b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com