基于云计算的RDF数据存储系统的研究
本文关键词: 资源描述框架 分布式系统 存储模型 云计算 出处:《合肥工业大学》2013年硕士论文 论文类型:学位论文
【摘要】:语义网的不断发展使得RDF数据存储系统成为一个重要的研究课题。传统RDF数据存储系统在互联网数据爆炸式增长的趋势下遭遇难题,存储能力和查询响应性能都已不能满足用户日益增长的需求。研究人员开始将目光转向云计算领域,云计算具有的海量数据存储和计算能力被认为是解决海量RDF数据存储难题的一个适宜方案,,该方面的研究尚处于起步阶段。 本文以海量RDF数据存储系统的设计和实现为目标,对RDF数据存储模型和查询方案进行研究,提出适合云计算环境下的RDF数据存储和查询方案。 合理的RDF数据存储模型对于提升RDF数据管理和查询性能具有重要作用。本文在分析现有RDF数据存储模型优缺点的基础上,提出基于有序二叉树的RDF数据存储模型。该模型不仅考虑RDF数据在自身结构方面的属性,而且融入云计算环境下数据存储和处理的特点。该模型在保证RDF数据查询响应效率的同时有效减少了存储开销,且能平滑应对RDF数据快速增长所带来的影响。 在RDF数据查询方面,本文通过研究并行计算框架MapReduce的运行机制,结合RDF数据存储模型的特点,以查询性能最优化为目标,提出查询任务生成算法,并证明该算法可有效提升查询响应效率。本文在该算法的基础上,进一步讨论基于有序二叉树的RDF数据模型的特点,给出具体的RDF数据查询响应方案。与传统RDF数据查询方案相比,该方案充分发挥云计算在数据处理方面的优势,有效提高RDF存储系统的数据查询效率。 本文最后针对所提出的RDF数据存储模型和查询方案设计了原型系统,并通过实验验证存储模型和查询方案的有效性。
[Abstract]:With the continuous development of semantic Web, RDF data storage system has become an important research topic. Traditional RDF data storage system has encountered difficulties in the trend of explosive growth of Internet data. Storage capacity and query response performance are no longer meeting the growing needs of users. Researchers are turning their eyes to the cloud computing world. Cloud computing has the ability to store and compute massive data, which is considered to be a suitable solution to solve the problem of massive RDF data storage, and the research in this field is still in its infancy. Aiming at the design and implementation of massive RDF data storage system, this paper studies the RDF data storage model and query scheme, and proposes a RDF data storage and query scheme suitable for cloud computing environment. Reasonable RDF data storage model plays an important role in improving RDF data management and query performance. This paper analyzes the advantages and disadvantages of existing RDF data storage models. This paper presents a RDF data storage model based on ordered binary tree, which not only considers the properties of RDF data in its own structure. This model not only ensures the efficiency of RDF data query response, but also reduces the storage cost, and can smoothly cope with the impact of the rapid growth of RDF data. In the aspect of RDF data query, by studying the running mechanism of parallel computing framework MapReduce, combining the characteristics of RDF data storage model and aiming at the optimization of query performance, a query task generation algorithm is proposed in this paper. It is proved that the algorithm can effectively improve the query response efficiency. Based on the algorithm, this paper further discusses the characteristics of RDF data model based on ordered binary tree. Compared with the traditional RDF data query scheme, the scheme gives full play to the advantages of cloud computing in data processing, and effectively improves the efficiency of data query in RDF storage system. Finally, a prototype system is designed for the proposed RDF data storage model and query scheme, and the validity of the storage model and query scheme is verified by experiments.
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 宋庆美,周明刚;基于XML的三个常用元数据描述工具的评价与比较[J];情报科学;2003年06期
2 梅晓勇,肖政宏;基于XML的排课系统研究与实现[J];湖南城建高等专科学校学报;2003年03期
3 董爱兵,王小平,曹立明;基于FIPA ACL和RDF的Agent通信语言[J];计算机应用研究;2005年07期
4 任磊;谭跃生;;基于RDF元数据的网格资源统一描述方法[J];内蒙古科技大学学报;2009年02期
5 任瑞娟;XML对数字图书馆的影响[J];大学图书馆学报;2002年06期
6 张惠文;基于XML的元数据架构[J];情报科学;2002年10期
7 张惠文;基于XML的元数据架构[J];现代情报;2002年07期
8 李晓红,侯敏;网络环境下元数据格式比较研究[J];图书馆学刊;2003年05期
9 罗三定,廖程锋;一种新的搜索引擎探讨[J];情报学报;2004年04期
10 周智昊;;资源描述框架的形式化表示问题研究[J];华中农业大学学报(社会科学版);2007年04期
相关会议论文 前10条
1 华雯;王琰;陈跃国;陈晋川;杜小勇;;一个基于演化聚类的RDF数据管理系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 陶导;钱卫宁;魏芳;周傲英;;基于关系数据库的RDF数据存储[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
3 吴刚;杨梦冬;;RDF数据的并行处理及性能评价[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 李勋龙;郭瑞强;丁祥武;乐嘉锦;;基于RDF模式的存储方法研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 周斌;雷建国;;一项新型垃圾衍生燃料(RDF)制备工艺系统[A];2010中国环境科学学会学术年会论文集(第四卷)[C];2010年
6 黄新艳;姚文琳;徐建良;;基于汉英双语语料库的汉英Ontology的建立与管理[A];第七届青年学术会议论文集[C];2005年
7 石翌轶;;基于前向链策略的RDF闭包生成技术研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 王伯春;刘宝林;李代禧;余德洋;;不同条件下水玻璃化过程的模拟[A];第六届全国低温生物医学及器械学术大会论文集[C];2009年
9 徐慧;刘会芬;肖德宝;熊磊;徐艳;;面向语义网的智能信息检索研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年
10 王丹;赵荣娟;;P2P系统中一种基于代理的RDF文档查询模型[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
相关重要报纸文章 前10条
1 ;惠普发布新一代数据存储系统[N];人民邮电;2004年
2 ;存储保平安[N];计算机世界;2002年
3 ;浪潮存储举办高端存储方案巡展[N];人民邮电;2006年
4 英小勇;“数据金库”的坚实地基[N];计算机世界;2002年
5 本报记者 钱炜;奥运助推我网络存储发展[N];科技日报;2005年
6 周晨;高校数字图书馆青睐IP SAN[N];科技日报;2007年
7 胡英;IP存储在“声色博客”中的实践[N];计算机世界;2007年
8 ;寻根——数据存储之根本[N];中国电脑教育报;2005年
9 义川;浪潮存储迈过“高”门槛[N];网络世界;2006年
10 周青邋编译;无重复备份是ILM成功的关键[N];计算机世界;2007年
相关博士学位论文 前10条
1 窦平安;电子商务语义信息共享模式[D];吉林大学;2009年
2 施冬材;基于对等网络的语义发布/订阅系统的关键技术研究[D];浙江大学;2007年
3 郭晓君;关联课程数据组织及知识管理研究[D];武汉大学;2012年
4 陈海霞;计算机数据存储系统中读写头/盘间超薄气膜动力稳定性研究[D];华中科技大学;2004年
5 姜赢;维度本体及其应用[D];武汉大学;2009年
6 魏青松;大规模分布式存储技术研究[D];电子科技大学;2004年
7 袁远明;智慧城市信息系统关键技术研究[D];武汉大学;2012年
8 谢铭;关联数据和知识表示的自动语义标注技术[D];武汉大学;2012年
9 孔兰菊;SaaS应用交付平台中多租户云数据管理关键技术研究[D];山东大学;2011年
10 欧阳鑫;基于本体导向的关联分析方法研究[D];昆明理工大学;2013年
相关硕士学位论文 前10条
1 秦冬生;基于云计算的RDF数据存储系统的研究[D];合肥工业大学;2013年
2 刘谱;高扩展的RDF数据存储系统研究[D];华中科技大学;2012年
3 程佳;一种基于Hadoop的RDF数据划分与存储研究[D];南京大学;2013年
4 刘畅;基于大规模模糊RDF数据的推理引擎[D];上海交通大学;2012年
5 陶承恺;基于属性表的RDF数据存储系统研究[D];南京大学;2013年
6 杨琴;基于关系数据库的RDF存储与查询的研究与实现[D];电子科技大学;2010年
7 卢珊;UML类图模型到RDF(S)的映射方法的研究[D];东北大学;2010年
8 孙博;RDF数据管理系统研究[D];天津大学;2010年
9 吴德龙;基于存储优化模型的RDF数据查询机制研究[D];华中科技大学;2011年
10 张坤林;基于RDF元数据查询和存储的研究[D];广西师范大学;2013年
本文编号:1554561
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1554561.html