当前位置:主页 > 科技论文 > 计算机论文 >

基于图数据库的海量RDF数据分布式存储

发布时间:2018-11-23 11:50
【摘要】:海量RDF数据的高效管理是语义网技术发展的关键部分,由于RDF数据模型的图特性,面对大规模RDF数据时,基于关系数据模型、对象数据模型等传统管理方式难以同时满足低数据冗余与高查询性能这两个要求。若以图方式管理RDF数据不仅可以避免RDF逻辑数据模型与物理数据模型之间的转换,而且可利用成熟的图算法优化RDF数据查询。因此本文设计了基于图数据库的海量RDF数据分布式存储的一个解决方案。 论文首先介绍了当前各类RDF数据管理方式以及它们的优缺点,并论述了基于图数据模型的管理方式对当前大规模RDF数据的适用性。接着介绍了课题相关的基本理论知识。然后给出了本文所设计的基于图数据库的海量RDF数据分布式存储的总体系统架构,,并详细介绍了系统中主要模块的设计细节与相关算法。最后在实验部分验证了基于图数据库的RDF数据管理方式其综合性能优于基于关系型数据库的管理方式,另外验证了系统所支持的分布式存储特性。论文主要有以下几个创新点:1)图数据库分布式存储扩展;2)基于图模型视角对RDF数据集进行分割;3)SPARQL查询语言到图查询语言的转换。
[Abstract]:The efficient management of massive RDF data is a key part of the development of semantic web technology. Because of the graph characteristics of RDF data model, when facing large-scale RDF data, it is based on relational data model. Traditional management methods such as object data model can not meet the two requirements of low data redundancy and high query performance. If RDF data is managed graphically, it can not only avoid the conversion between RDF logical data model and physical data model, but also optimize RDF data query by using mature graph algorithm. Therefore, this paper designs a solution for distributed storage of massive RDF data based on graph database. Firstly, this paper introduces the current RDF data management methods and their advantages and disadvantages, and discusses the applicability of the management mode based on the graph data model to the current large-scale RDF data. Then introduced the topic related basic theory knowledge. Then, the architecture of the distributed storage system of massive RDF data based on graph database is presented in this paper, and the design details of the main modules and the related algorithms are introduced in detail. Finally, the experimental results show that the comprehensive performance of RDF data management based on graph database is better than that of relational database, and the distributed storage characteristics supported by the system are verified. The main innovations of this paper are as follows: 1) distributed storage extension of graph database; 2) segmentation of RDF data set based on graph model; 3) transformation from SPARQL query language to graph query language.
【学位授予单位】:武汉科技大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13

【共引文献】

相关期刊论文 前7条

1 王进鹏;张亚非;苗壮;;SPARQL查询的关系代数表示与转换方法[J];计算机工程与应用;2011年22期

2 袁平鹏;刘谱;张文娅;吴步文;;高可扩展的RDF数据存储系统[J];计算机研究与发展;2012年10期

3 李心科;秦冬生;;基于有序二叉树的RDF存储模型研究[J];合肥工业大学学报(自然科学版);2013年07期

4 陈立玮;冯岩松;赵东岩;;基于弱监督学习的海量网络数据关系抽取[J];计算机研究与发展;2013年09期

5 杜方;陈跃国;杜小勇;;RDF数据查询处理技术综述[J];软件学报;2013年06期

6 虞为;陈俊鹏;;基于MapReduce的书目数据关联匹配研究[J];现代图书情报技术;2013年09期

7 于彤;陈华钧;李敬华;;中医药语义维基系统研发[J];中国医学创新;2013年34期

相关会议论文 前1条

1 刘谱;王晶;袁平鹏;吴步文;;大规模RDF数据库系统TripleBit[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

相关博士学位论文 前3条

1 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年

2 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年

3 唐富年;面向语义正确性的集成数据访问方法研究[D];国防科学技术大学;2012年

相关硕士学位论文 前10条

1 吴德龙;基于存储优化模型的RDF数据查询机制研究[D];华中科技大学;2011年

2 伍印廷;RDFBase的查询优化和性能评估[D];天津大学;2012年

3 刘谱;高扩展的RDF数据存储系统研究[D];华中科技大学;2012年

4 朱敏;基于HBase的RDF数据存储与查询研究[D];南京大学;2013年

5 王北辰;基于结构化索引的RDF数据存储及查询方法的研究与实现[D];北京交通大学;2013年

6 李博;基于语义关系的高血压临床指南知识库构建[D];电子科技大学;2013年

7 刘晓丽;总分关系及其在语义Web查询中的应用[D];大连海事大学;2013年

8 秦冬生;基于云计算的RDF数据存储系统的研究[D];合肥工业大学;2013年

9 宋纪成;海量RDF数据存储与查询技术的研究与实现[D];北京工业大学;2013年

10 赵振财;分布式环境下大规模图数据上距离查询研究[D];哈尔滨工业大学;2013年



本文编号:2351503

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2351503.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d6074***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com