海量RDF数据的分布式存储研究
发布时间:2020-04-25 08:48
【摘要】: 随着Web数据和各种网络资源剧增以及语义网的兴起与发展,海量RDF(Resource Description Framework,资源描述框架)数据存储已成为当前Web数据存储领域的研究热点。作者在深入学习和研究了当前流行的若干分布式存储框架后,提出了海量RDF数据分布式存储的一种解决方案,并在linux集群上实现了高效、协作地海量RDF数据存储。 首先,作者在深入对比分析了若干种分布式存储框架之后,结合本项目的特点,选定了开源存储框架Hbase (Hadoop DataBase, Hadoop数据库),实现了把海量稀疏的RDF数据集中存储在一个Hbase表中,这样不仅解决了传统关系数据库的低效率联合查询问题,并且我们还可以在分布式平台上使用MapReduce并行算法加快处理速度。 其次,论文剖析了开源框架Hadoop分布式数据平台以及语义网基础框架Jena,并依托于此框架完成RDF/XML文档的解析和RDF模型的创建、以及一些模型的语义分析,作者几乎重写了Jena所有存储方面的底层代码,使得把数据的存储迁移到分布式平台,还重写了Jena模型解析和查询的部分代码,使其能充分发挥分布式处理的强大作用。加快查询效率和处理速度,这也为快速发展语义网奠定了基础。 最后作者总结了整个项目的研究结果,结合自己的研究方向,提出了将来的研究目标和展望。
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP333
本文编号:2640040
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP333
【引证文献】
相关硕士学位论文 前3条
1 程西;数字油田中非结构化数据管理系统的设计与实现[D];西北大学;2011年
2 刘燕;基于Map/Reduce框架的分布式日志分析系统的研究及应用[D];东北师范大学;2011年
3 郭志恒;云计算环境下GML空间数据存储索引机制研究[D];江西理工大学;2012年
,本文编号:2640040
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2640040.html