基于图数据库的RDF数据分布式存储
【图文】:
录?个方面:(1)RDF数据集到图数据模型的映射;(2)图数据库分布式存储扩展,本文采用Neo4j图形数据库,并设计了一个逻辑处理层,以支持分布式存储;(3)从图模型视角对RDF数据集进行分割,本文采用文献[14]提出的针对大图数据流的分割算法,用于对RDF图数据流的分割;(4)提供SPARQL查询接口,CYPHER是Neo4j图形数据库支持的一个数据查询语言,本文将讨论SPARQL查询语言到CYPHER查询语言的转换。2基于图数据库的RDF数据分布式存储方案2.1系统总体架构本文提出的基于图数据库的RDF数据分布式存储方案总体架构如图1所示。图1基于图数据库的RDF数据分布式存储方案总体架构2.2RDF数据集到图数据模型的映射RDF数据集由很多RDF语句组成,每条RDF语句是一个三元组<主体,属性,客体>,其中主体是被描述的资源,客体表示主体在属性上的取值,可以是另外一个资源或者是文本。若从图数据模型视角看,主体、客体对应图中的顶点,属性对应图中的一条有向边,一条RDF语句对应于图中的两个顶点、从主体顶点指向客体顶点的一条有向边。映射关系如图2所示。图2RDF数据集到图数据模型的映射2.3分布式存储为支持分布式存储,存储层各个RDF数据存储节点相互独立,在其之上增加一层逻辑处理层,往系统存入RDF数据时,记录这个RDF数据的存储位置;查询RDF数据时,先获取所查RDF数据可能的存储位置,然后到对应的存储节点上进行查询。系统需要存储两类数据,一类是元数据,主要为RDF数据的存储位置信息,本文用Redis[15]数据库,这是Key-Value型内存数据库,读取速度快,且支持持久化,存储时以资源ID、属性ID作为Key,存储位置作为Value。另一类是RDF数据,本文用Neo4j图形数据库,存入一条RDF语句将往图数据库中插?
储方案2.1系统总体架构本文提出的基于图数据库的RDF数据分布式存储方案总体架构如图1所示。图1基于图数据库的RDF数据分布式存储方案总体架构2.2RDF数据集到图数据模型的映射RDF数据集由很多RDF语句组成,每条RDF语句是一个三元组<主体,属性,客体>,,其中主体是被描述的资源,客体表示主体在属性上的取值,可以是另外一个资源或者是文本。若从图数据模型视角看,主体、客体对应图中的顶点,属性对应图中的一条有向边,一条RDF语句对应于图中的两个顶点、从主体顶点指向客体顶点的一条有向边。映射关系如图2所示。图2RDF数据集到图数据模型的映射2.3分布式存储为支持分布式存储,存储层各个RDF数据存储节点相互独立,在其之上增加一层逻辑处理层,往系统存入RDF数据时,记录这个RDF数据的存储位置;查询RDF数据时,先获取所查RDF数据可能的存储位置,然后到对应的存储节点上进行查询。系统需要存储两类数据,一类是元数据,主要为RDF数据的存储位置信息,本文用Redis[15]数据库,这是Key-Value型内存数据库,读取速度快,且支持持久化,存储时以资源ID、属性ID作为Key,存储位置作为Value。另一类是RDF数据,本文用Neo4j图形数据库,存入一条RDF语句将往图数据库中插入两个顶点及两顶点之间的一条边,并以资源ID、属性ID分别对顶点、边建立索引,查询时利用索引可直接定位到某个顶点或边。2.4逻辑处理层2.4.1分区管理RDF数据模型是一个图模型,本文从图模型视角对RDF数据进行分割,决策RDF数据的存储位置,划分的准则是尽量将关联比较紧密的顶点划到同一个分区,因为当在RDF数据集上做推理查询时会涉及到遍历操作,而关联比较紧密的顶点在遍历路径上的概率比较大,这样可减少跨存储节点之
【相似文献】
相关期刊论文 前10条
1 王征;刘心松;李美安;;企业信息分布式存储的热点处理策略[J];计算机集成制造系统;2006年09期
2 李磊;沈海斌;黄凯;严晓浪;Han Sangil;Ahmed A Jerraya;;分布式存储管理在多核设计中的高层建模[J];电子与信息学报;2008年11期
3 刘翔;汪海玲;;分布式存储中的一种数据放置策略[J];计算机与数字工程;2009年05期
4 陈卫卫;吴海佳;胥光辉;;分布式存储中文件分割的最优化模型[J];解放军理工大学学报(自然科学版);2010年04期
5 崔忠强;左德承;张展;;在云间可重构的分布式存储[J];系统工程理论与实践;2011年S2期
6 郝杰;逯彦博;刘鑫吉;夏树涛;;分布式存储中的再生码综述[J];重庆邮电大学学报(自然科学版);2013年01期
7 唐京伟;;基于云计算的分布式存储技术[J];中国传媒科技;2013年15期
8 郭栋;王伟;曾国荪;;基于一致性树分布的数据分布式存储方法[J];计算机应用;2013年12期
9 苏李亮;王云福;侯斌;;海量设计文档分布式存储及负载均衡的研究与实现[J];电信科学;2013年12期
10 谢然;;敢问存储之路在何方?见分布式存储摇曳在数据枝头[J];互联网周刊;2014年02期
相关会议论文 前7条
1 苏李亮;王云福;侯斌;;海量设计文档分布式存储及负载均衡的研究与实现[A];2013电力行业信息化年会论文集[C];2013年
2 苏李亮;王云福;侯斌;;海量设计文档分布式存储及负载均衡的研究与实现[A];2013电力行业信息化年会论文集[C];2013年
3 郑文武;李先绪;黄植勤;邱红飞;;云存储关键技术[A];2012全国无线及移动通信学术大会论文集(下)[C];2012年
4 蒋轶林;郭淑琴;;分布式存储在数字集群移动通信系统中的应用[A];浙江省电子学会2013学术年会论文集[C];2013年
5 姜继忱;陈钢;;P2P之路——缔造“分布式对等”的Internet3.0[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
6 付伟;肖侬;卢锡城;;QoS感知的副本放置问题研究综述[A];第15届全国信息存储技术学术会议论文集[C];2008年
7 张彦;刘欣然;徐慧彬;;一种基于虚拟计算环境的分布式存储体系结构[A];2009全国计算机网络与通信学术会议论文集[C];2009年
相关重要报纸文章 前8条
1 京东架构委员会主任 云平台首席架构师 系统技术部负责人 刘海锋;京东:分布式存储体系成为业务基石[N];中国信息化周报;2014年
2 《网络世界》记者 于翔;京东分布式存储体系研发历程[N];网络世界;2014年
3 《网络世界》记者 于翔;融合一体机投入大规模商用[N];网络世界;2013年
4 记者 余荣华;大数据,催生大变革[N];人民日报;2014年
5 本报记者 张佳星;新生产业布局如何“云”中索骥[N];科技日报;2014年
6 本报记者 甘露;物联网让管理更美妙[N];计算机世界;2013年
7 本报记者 郭涛;华为帮用户定制HANA一体机[N];中国计算机报;2013年
8 临江;手机浏览器,3G时代的采矿机?[N];人民邮电;2009年
相关博士学位论文 前8条
1 胡q
本文编号:2586672
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2586672.html