基于BSP的SPARQL基本图模式查询
发布时间:2018-05-15 19:47
本文选题:语义网 + 资源描述框架 ; 参考:《天津大学》2014年硕士论文
【摘要】:随着语义网的不断发展以及开放链接运动深入展开,发布在互联网上的RDF数据不仅已达到百亿级三元组规模,而且呈现出几何增长的趋势。有效的管理和查询这些RDF数据,正显得日益重要。传统的单机上针对RDF数据的SPARQL基本图模式查询算法,不能满足RDF数据日益增长的需求。而基于MapReduce分布式计算模型的SPARQL基本图模式查询方法,不能够充分发挥分布式计算的潜力,并行度有待提高。 针对该问题,本文提出了一种基于BSP模型的SPARQL基本图模式算法。根据RDF数据是有向图数据的特性以及基本图模式的定义,把整个查询过程分成“匹配”和“迭代”两个阶段,先匹配出每个要查询的三元组模式,然后通过迭代让部分解逐步逼近完全解,,最后得到查询结果。根据本文提出的基于BSP模型的SPARQL基本图模式算法,设计并实现了一个SPARQL查询机原型。该SPARQL查询机原型的查询引擎部分采用BSP模型分布式计算框架——HAMA实现。在数据持久层,该SPARQL查询原型机中引入了基于Cassandra数据库存储RDF图数据,以满足RDF数据能够得到有效管理和快速加载的需要。此外,还设计了针对本文提出的基于BSP模型的SPARQL基本图模式算法的特有的缓存机制,提高查询速度。在实验部分,与前人提出的基于MapReduce模型的SPARQL基本图模式算法的查询时间对比实验。实验结果表明,本文提出的基于BSP模型的SPARQL基本图模式算法查询效率得到提升。 总的来说,本文提出的基于BSP模型的SPARQL基本图模式算法充分利用了BSP模型的消息机制,相对前人提出的基于MapReduce模型SPARQL基本图模式算法,在并行度上更优。从而可以为大规模RDF数据的快速SPARQL查询提供支持。
[Abstract]:With the development of semantic network and the deep development of open link movement , RDF data published on the Internet has not only reached 100 billion triple - tuple scale , but also presents the trend of geometric growth .
In order to solve the problem , this paper presents an algorithm based on BSP model , which is based on BSP model . The query engine is implemented by using BSP model distributed computing framework _ HAMA .
In general , the BSP model - based model based on BSP model makes full use of the BSP model ' s message mechanism , which is superior to the MapReduce model based on the MapReduce model based on the MapReduce model .
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.41;TP393.4
【参考文献】
相关期刊论文 前4条
1 王鑫;冯志勇;杜朴风;饶国政;姜洋;李旭;生兆花;姜龙翔;;Jingwei:一种分布式大规模RDF数据服务器[J];计算机研究与发展;2011年S3期
2 杜方;陈跃国;杜小勇;;RDF数据查询处理技术综述[J];软件学报;2013年06期
3 沈志宏;黎建辉;张晓林;;关联数据互联技术研究综述:应用、方法与框架[J];图书情报工作;2013年14期
4 何少鹏;黎建辉;沈志宏;周园春;;大规模的RDF数据存储技术综述[J];网络新媒体技术;2013年01期
本文编号:1893667
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1893667.html