分布式RDF关键词近似搜索方法
本文选题:RDF 切入点:关键词 出处:《中国科学技术大学学报》2017年10期
【摘要】:现有的RDF关键词搜索方法主要是在大规模的RDF数据图上直接进行搜索,未能充分利用RDF本体中的语义信息,迭代次数过多造成搜索效率和效果不理想.针对这些问题,借助Redis内存数据库集群,提出分布式RDF关键词近似搜索算法(DKASR),即在分布式平台上实现大规模数据的并行搜索.算法结合RDF本体的语义信息构建本体子图,利用语义评分函数对本体子图进行排序,借助MapReduce计算模型实现并行搜索并返回Top-k结果;如果返回的结果没有达到Top-k,则对本体子图进行扩展生成近似本体子图,使用语义相似度函数对近似本体子图进行排序,再利用MapReduce计算模型实现并行搜索,直到返回Top-k结果.实验结果表明,DKASR算法能够高效正确地实现RDF关键词近似搜索并有效返回Top-k结果.
[Abstract]:The existing RDF keyword search methods are mainly based on the large-scale RDF data graph, and the semantic information in the RDF ontology is not fully utilized, so the search efficiency and effect are not satisfactory due to the excessive number of iterations. With the help of Redis memory database cluster, a distributed RDF keyword approximate search algorithm, named DKASRN, is proposed, that is, parallel search of large-scale data is realized on distributed platform. The algorithm combines semantic information of RDF ontology to construct ontology subgraph. The semantic scoring function is used to sort the ontology subgraph, and the MapReduce computing model is used to realize the parallel search and return the Top-k result. If the returned result does not reach Top-k, the ontology subgraph is extended to generate the approximate ontology subgraph. The semantic similarity function is used to sort the approximate ontology subgraph, and the MapReduce computing model is used to realize the parallel search. The experimental results show that the DKASR algorithm can efficiently and correctly realize the approximate search of RDF keywords and return the Top-k results effectively.
【作者单位】: 福州大学数学与计算机科学学院;
【基金】:国家自然科学基金(61300104) 福建省科技拥军基金(JG2014001) 福建省自然科学基金(2012J01168) 福州大学科技发展基金(2013-XQ-32)资助
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 杨书新;徐慧琴;谭伟;;结合查询相关性的关键词查询排序方法[J];计算机工程与设计;2013年09期
2 梁银;董永权;;基于对象集合的空间关键词查询[J];计算机应用;2014年07期
3 张颖;李昕;;一种关系数据库上的关键词查询排序方法[J];辽宁工业大学学报(自然科学版);2013年05期
4 寇苏玲;蔡庆生;;应用于用户兴趣建模的多文本关键词抽取研究[J];计算机仿真;2007年02期
5 林子雨;杨冬青;王腾蛟;张东站;;基于关系数据库的关键词查询[J];软件学报;2010年10期
6 林子雨;邹权;赖永炫;林琛;;关系数据库中的关键词查询结果动态优化[J];软件学报;2014年03期
7 李慧颖;瞿裕忠;;基于关键词的RDF数据查询方法[J];东南大学学报(自然科学版);2010年02期
8 杨书新;徐慧琴;;基于数据图的关系数据库关键词查询排序研究[J];计算机应用研究;2014年02期
9 海沫;郭树行;;网络环境中基于语义聚类的多关键词查询机制[J];图书情报工作;2012年20期
10 万常选;邓松;刘德喜;江腾蛟;刘喜平;;面向混合类型关键词查询的非合作结构化深网数据源选择[J];计算机研究与发展;2014年04期
相关会议论文 前3条
1 杨艳;何天宇;;基于短语的关系数据库关键词查询方法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
2 李_,
本文编号:1656166
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1656166.html