基于HBase的本体存储与查询的研究
发布时间:2023-02-23 19:21
语义网(Semantic Web)从提出到现在,受到越来越多的个人、研究机构和企业组织的关注。本体作为语义网数据的核心,主要通过RDF三元组进行描述。近年来互联网数据骤增,也让以RDF陈述为基础的本体数据存储面临越来越大的压力,如何高效的存储与查询本体数据成为研究的热点。 本文在总结分析RDF存储系统、RDF查询语言、非关系型数据库HBase以及分布式框架Hadoop的应用现状的基础上,讨论设计了基于分布式HBase存储的RDF存储模型。并在存储模型的基础上,设计了本体存储表结构。通过分析SPARQL查询语言的原理与特性,设计并实现了基于HBase的RDF核心三元组匹配算法,且在该算法的基础上,设计了基于SPARQL图模式(基本模式、组图模式、Optional图模式、Alternative图模式)的查询匹配算法。 最后本文介绍了搭建基于Hadoop单机伪分布式和Hadoop分布式集群两种架构的环境,在此环境下,通过实验,验证了本文所提出的本体分布式存储和相关查询算法的可行性与有效性。
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
目录
第一章 绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 RDF 存储系统现状
1.2.2 RDF 查询语言现状
1.2.3 非关系型数据库发展现状
1.2.4 分布式 Hadoop 的应用现状
1.3 研究内容
1.4 论文结构安排和框架
第二章 相关技术
2.1 本体技术
2.1.1 RDF 资源描述框架
2.1.2 RDF 存储模型
2.1.3 RDF 查询
2.2 分布式技术
2.2.1 分布式架构 Hadoop
2.2.2 文件系统 HDFS
2.2.3 分布式计算 MapReduce
2.2.4 分布式存储 HBase
第三章 基于 HBase 存储模型的构建
3.1 类关系存储模型
3.2 属性关系存储模型
3.3 实例存储模型
3.4 小结
第四章 基于 HBase 查询算法设计
4.1 SPARQL 查询模式
4.2 RDF 三元组匹配
4.3 基于基本图模式的查询
4.4 基于组图模式的查询
4.5 基于 Optional 图模式的查询
4.6 基于 Alternative 图模式的查询
4.7 小结
第五章 实验与分析
5.1 实验平台
5.2 实验数据加载
5.2.1 数据生成
5.2.2 数据加载
5.3 实验分析和评估
5.3.1 RDF 三元组匹配实验
5.3.2 图模式查询实验
5.4 小结
第六章 总结
6.1 主要工作回顾
6.2 本课题今后需进一步研究的地方
参考文献
个人简历 在读期间发表的学术论文
致谢
本文编号:3748595
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
目录
第一章 绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 RDF 存储系统现状
1.2.2 RDF 查询语言现状
1.2.3 非关系型数据库发展现状
1.2.4 分布式 Hadoop 的应用现状
1.3 研究内容
1.4 论文结构安排和框架
第二章 相关技术
2.1 本体技术
2.1.1 RDF 资源描述框架
2.1.2 RDF 存储模型
2.1.3 RDF 查询
2.2 分布式技术
2.2.1 分布式架构 Hadoop
2.2.2 文件系统 HDFS
2.2.3 分布式计算 MapReduce
2.2.4 分布式存储 HBase
第三章 基于 HBase 存储模型的构建
3.1 类关系存储模型
3.2 属性关系存储模型
3.3 实例存储模型
3.4 小结
第四章 基于 HBase 查询算法设计
4.1 SPARQL 查询模式
4.2 RDF 三元组匹配
4.3 基于基本图模式的查询
4.4 基于组图模式的查询
4.5 基于 Optional 图模式的查询
4.6 基于 Alternative 图模式的查询
4.7 小结
第五章 实验与分析
5.1 实验平台
5.2 实验数据加载
5.2.1 数据生成
5.2.2 数据加载
5.3 实验分析和评估
5.3.1 RDF 三元组匹配实验
5.3.2 图模式查询实验
5.4 小结
第六章 总结
6.1 主要工作回顾
6.2 本课题今后需进一步研究的地方
参考文献
个人简历 在读期间发表的学术论文
致谢
本文编号:3748595
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3748595.html