当前位置:主页 > 科技论文 > 计算机论文 >

基于HBase的RDF数据存储与查询研究

发布时间:2020-10-11 11:40
   近年来,随着语义网技术的不断发展与进步,用来描述语义网资源的资源描述框架(RDF)越来越多地应用于各个领域,RDF的广泛应用使得其数据量急速增长,如何高效地管理海量RDF数据成为一个急待解决的问题。现有的RDF数据管理系统大都采用传统的关系型数据库来存储RDF数据,随着RDF数据的爆炸式增长,这种方式已难以高效地管理海量RDF数据。有研究表明关系型数据库在处理海量RDF数据时存储与查询效率都比分布式数据库低,越来越多的研究者开始利用分布式系统的海量数据存储与并行计算能力解决海量RDF数据管理问题。 海量RDF数据管理的研究主要分为两个方面:第一,如何有效地存储海量RDF数据;第二,如何高效地查询RDF数据。本文针对这两个问题提出一种基于分布式数据库HBase的RDF数据存储模型,设计并实现该存储模型上的SPARQL BGP查询算法。 论文的主要工作如下: (1)提出一种基于分布式数据库HBase的RDF数据存储模型,根据OWL描述的本体信息,将RDF实例数据按类划分,主语为同一类的三元组数据保存在该类的S PO和O PS两张存储表中,充分利用HBase提供的Row-key索引,在保证查询性能的同时有效地减少了存储开销。 (2)利用HBase Java API实现该存储模型上的SPARQL查询与更新操作,设计满足八种形式Triple Pattern的Triple Pattern查询算法、提供满足子类、子属性和逆属性三种推理关系的Triple Pattern推理算法以及SPARQL基本图模式(Basic Graph Pattern, BGP)查询算法。并且根据BGP中子句的选择度、子句之间是否有共享变量以及子句的谓语是否为rdf:type对BGP查询算法进行优化。 (3)采用RDF标准测试数据集LUBM分别在单机伪分布式Hadoop系统以及真实的分布式Hadoop集群环境下对存储模型与查询算法进行了实验评估,实验对不同大小的数据集分别执行LUBM提供的14种查询,验证了存储模型和查询算法的可行性,并且对BGP优化前与优化后的查询性能进行了分析与比较。并且与现有的存储模型与查询算法进行比较,通过对比实验证明了本文提出的方案的有效性。
【学位单位】:南京大学
【学位级别】:硕士
【学位年份】:2013
【中图分类】:TP311.13;TP333
【文章目录】:
摘要
Abstract
目录
第一章 绪论
    1.1 研究背景及意义
    1.2 研究现状及热点
    1.3 本文研究内容
    1.4 本文组织机构
第二章 相关技术综述
    2.1 语义网相关技术
        2.1.1 RDF
        2.1.2 RDF Schema
        2.1.3 本体
        2.1.4 SPARQL
    2.2 分布式计算技术
        2.2.1 MapReduce
        2.2.2 Hadoop
        2.2.3 HBase
    2.3 现有的RDF数据存储模型
        2.3.1 集中式关系型RDF数据存储
        2.3.2 分布式RDF数据存储
    2.4 本章小结
第三章 基于HBase的RDF数据存储模型
    3.1 本体模型存储
    3.2 RDF实例数据存储
    3.3 与其他存储模型的比较
    3.4 本章小结
第四章 SPARQL查询与更新算法
    4.1 SPARQL查询算法
        4.1.1 SPARQL BGP查询总体架构
        4.1.2 Triple Pattern与三元组匹配算法matchTP_T
        4.1.3 单个Triple Pattern查询算法QueryTP
        4.1.4 推理算法ReasonTP
        4.1.5 BGP查询算法QueryBGP
    4.2 BGP查询示例
    4.3 BGP查询优化
    4.4 更新算法
    4.5 本章小结
第五章 实验结果与分析
    5.1 实验环境
    5.2 数据加载
    5.3 实验结果分析
    5.4 与其他方案实验对比
    5.5 本章小结
第六章 总结与展望
    6.1 论文总结
    6.2 进一步的研究工作
致谢
参考文献

【参考文献】

相关期刊论文 前2条

1 杜小勇;王琰;吕彬;;语义Web数据管理研究进展[J];软件学报;2009年11期

2 鲍文;李冠宇;;本体存储技术研究[J];计算机技术与发展;2008年01期



本文编号:2836544

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2836544.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0284a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com