当前位置:主页 > 科技论文 > 计算机论文 >

基于图数据库的RDF数据分布式存储

发布时间:2020-03-13 02:59
【摘要】:RDF数据模型具有天然的图结构,因此以图结构存储可以避免RDF逻辑数据模型到物理数据模型的转换。基于图数据库的RDF数据分布式存储方案,重点讨论RDF图数据流分割、图数据库分布式扩展、SPARQL查询语言转CYPHER图形查询语言等。实验对比了基于Neo4j图数据库与基于MySQL关系型数据库的RDF数据存储方案的处理性能,并验证了RDF图数据流分割算法的有效性。
【图文】:

数据分布,图数,存储方案,总体架构


录?个方面:(1)RDF数据集到图数据模型的映射;(2)图数据库分布式存储扩展,本文采用Neo4j图形数据库,并设计了一个逻辑处理层,以支持分布式存储;(3)从图模型视角对RDF数据集进行分割,本文采用文献[14]提出的针对大图数据流的分割算法,用于对RDF图数据流的分割;(4)提供SPARQL查询接口,CYPHER是Neo4j图形数据库支持的一个数据查询语言,本文将讨论SPARQL查询语言到CYPHER查询语言的转换。2基于图数据库的RDF数据分布式存储方案2.1系统总体架构本文提出的基于图数据库的RDF数据分布式存储方案总体架构如图1所示。图1基于图数据库的RDF数据分布式存储方案总体架构2.2RDF数据集到图数据模型的映射RDF数据集由很多RDF语句组成,每条RDF语句是一个三元组<主体,属性,客体>,其中主体是被描述的资源,客体表示主体在属性上的取值,可以是另外一个资源或者是文本。若从图数据模型视角看,主体、客体对应图中的顶点,属性对应图中的一条有向边,一条RDF语句对应于图中的两个顶点、从主体顶点指向客体顶点的一条有向边。映射关系如图2所示。图2RDF数据集到图数据模型的映射2.3分布式存储为支持分布式存储,存储层各个RDF数据存储节点相互独立,在其之上增加一层逻辑处理层,往系统存入RDF数据时,记录这个RDF数据的存储位置;查询RDF数据时,先获取所查RDF数据可能的存储位置,然后到对应的存储节点上进行查询。系统需要存储两类数据,一类是元数据,主要为RDF数据的存储位置信息,本文用Redis[15]数据库,这是Key-Value型内存数据库,读取速度快,且支持持久化,存储时以资源ID、属性ID作为Key,存储位置作为Value。另一类是RDF数据,本文用Neo4j图形数据库,存入一条RDF语句将往图数据库中插?

数据分布,分布式存储,图数,数据集


储方案2.1系统总体架构本文提出的基于图数据库的RDF数据分布式存储方案总体架构如图1所示。图1基于图数据库的RDF数据分布式存储方案总体架构2.2RDF数据集到图数据模型的映射RDF数据集由很多RDF语句组成,每条RDF语句是一个三元组<主体,属性,客体>,,其中主体是被描述的资源,客体表示主体在属性上的取值,可以是另外一个资源或者是文本。若从图数据模型视角看,主体、客体对应图中的顶点,属性对应图中的一条有向边,一条RDF语句对应于图中的两个顶点、从主体顶点指向客体顶点的一条有向边。映射关系如图2所示。图2RDF数据集到图数据模型的映射2.3分布式存储为支持分布式存储,存储层各个RDF数据存储节点相互独立,在其之上增加一层逻辑处理层,往系统存入RDF数据时,记录这个RDF数据的存储位置;查询RDF数据时,先获取所查RDF数据可能的存储位置,然后到对应的存储节点上进行查询。系统需要存储两类数据,一类是元数据,主要为RDF数据的存储位置信息,本文用Redis[15]数据库,这是Key-Value型内存数据库,读取速度快,且支持持久化,存储时以资源ID、属性ID作为Key,存储位置作为Value。另一类是RDF数据,本文用Neo4j图形数据库,存入一条RDF语句将往图数据库中插入两个顶点及两顶点之间的一条边,并以资源ID、属性ID分别对顶点、边建立索引,查询时利用索引可直接定位到某个顶点或边。2.4逻辑处理层2.4.1分区管理RDF数据模型是一个图模型,本文从图模型视角对RDF数据进行分割,决策RDF数据的存储位置,划分的准则是尽量将关联比较紧密的顶点划到同一个分区,因为当在RDF数据集上做推理查询时会涉及到遍历操作,而关联比较紧密的顶点在遍历路径上的概率比较大,这样可减少跨存储节点之

【相似文献】

相关期刊论文 前10条

1 王征;刘心松;李美安;;企业信息分布式存储的热点处理策略[J];计算机集成制造系统;2006年09期

2 李磊;沈海斌;黄凯;严晓浪;Han Sangil;Ahmed A Jerraya;;分布式存储管理在多核设计中的高层建模[J];电子与信息学报;2008年11期

3 刘翔;汪海玲;;分布式存储中的一种数据放置策略[J];计算机与数字工程;2009年05期

4 陈卫卫;吴海佳;胥光辉;;分布式存储中文件分割的最优化模型[J];解放军理工大学学报(自然科学版);2010年04期

5 崔忠强;左德承;张展;;在云间可重构的分布式存储[J];系统工程理论与实践;2011年S2期

6 郝杰;逯彦博;刘鑫吉;夏树涛;;分布式存储中的再生码综述[J];重庆邮电大学学报(自然科学版);2013年01期

7 唐京伟;;基于云计算的分布式存储技术[J];中国传媒科技;2013年15期

8 郭栋;王伟;曾国荪;;基于一致性树分布的数据分布式存储方法[J];计算机应用;2013年12期

9 苏李亮;王云福;侯斌;;海量设计文档分布式存储及负载均衡的研究与实现[J];电信科学;2013年12期

10 谢然;;敢问存储之路在何方?见分布式存储摇曳在数据枝头[J];互联网周刊;2014年02期

相关会议论文 前7条

1 苏李亮;王云福;侯斌;;海量设计文档分布式存储及负载均衡的研究与实现[A];2013电力行业信息化年会论文集[C];2013年

2 苏李亮;王云福;侯斌;;海量设计文档分布式存储及负载均衡的研究与实现[A];2013电力行业信息化年会论文集[C];2013年

3 郑文武;李先绪;黄植勤;邱红飞;;云存储关键技术[A];2012全国无线及移动通信学术大会论文集(下)[C];2012年

4 蒋轶林;郭淑琴;;分布式存储在数字集群移动通信系统中的应用[A];浙江省电子学会2013学术年会论文集[C];2013年

5 姜继忱;陈钢;;P2P之路——缔造“分布式对等”的Internet3.0[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年

6 付伟;肖侬;卢锡城;;QoS感知的副本放置问题研究综述[A];第15届全国信息存储技术学术会议论文集[C];2008年

7 张彦;刘欣然;徐慧彬;;一种基于虚拟计算环境的分布式存储体系结构[A];2009全国计算机网络与通信学术会议论文集[C];2009年

相关重要报纸文章 前8条

1 京东架构委员会主任 云平台首席架构师 系统技术部负责人 刘海锋;京东:分布式存储体系成为业务基石[N];中国信息化周报;2014年

2 《网络世界》记者 于翔;京东分布式存储体系研发历程[N];网络世界;2014年

3 《网络世界》记者 于翔;融合一体机投入大规模商用[N];网络世界;2013年

4 记者 余荣华;大数据,催生大变革[N];人民日报;2014年

5 本报记者 张佳星;新生产业布局如何“云”中索骥[N];科技日报;2014年

6 本报记者 甘露;物联网让管理更美妙[N];计算机世界;2013年

7 本报记者 郭涛;华为帮用户定制HANA一体机[N];中国计算机报;2013年

8 临江;手机浏览器,3G时代的采矿机?[N];人民邮电;2009年

相关博士学位论文 前8条

1 胡q

本文编号:2586672


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2586672.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18918***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com