基于HBase的RDF数据存储方案研究与设计
发布时间:2017-11-09 00:04
本文关键词:基于HBase的RDF数据存储方案研究与设计
更多相关文章: 语义网 RDF数据 HBase MapReduce HFile文件
【摘要】:针对RDF数据的存储问题,文章提出一种利用分布式数据库HBase以及设计数据库的Rowkey进行有效存储的方案,主要利用HBase与RDF数据的特点,使用经典的BKDRHash算法对谓词进行散列计算,将散列值与谓词作为主键,实现数据的存储。有效设置HBase的Rowkey不仅避免出现节点堆积现象,BKDRHash算法的使用也保证了数据的完整性。为证明该存储模式的有效性,文章实验选择利用Map Reduce将数据生成HBase内部存储格式HFile文件进行并行加载。实验证明,针对这样的存储模式,当数据量很大时数据加载性能较好。使用LUBM测试集进行仿真实验,证明该方案是有效的。
【作者单位】: 贵州大学计算机科学与技术学院;贵州大学大数据与信息工程学院;
【基金】:黔科合JZ字[2014]2001
【分类号】:TP333;TP311.13
【正文快照】: 络安全,2016(3):59-63.0引言RDF(Resource Description Framework)是W3C提出的一个资源描述框架,通过对网络资源进行一定程度的语义描述,为计算机能够模拟大脑理解语义信息提供可能。而随着LOD(Linking Open Data)等项目的展开[1],大量的RDF数据发布,互联网中包含的RDF数据已,
本文编号:1159399
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1159399.html