面向在线分析的语义网数据存储系统研究
发布时间:2022-07-20 18:14
高效的语义网数据存储、查询是实现成功语义网应用的重要基础。语义网数据采用灵活的RDF(Resource Description Framework)来表达,是一种高度稀疏的图数据。目前对语义网数据的管理通常采用三元组表、属性表等基于关系数据库的方式来管理。但语义网数据的高度灵活性、稀疏图特征,使得这些方式存在查询效率和存储空间利用率低、可扩展性差等问题。针对此有研究提出了一些语义网数据组织与查询优化方法,但大多局限于语义网数据抽取式查询,而非语义网数据分析式查询,而后者在语义网应用中非常普遍。这使得目前的语义网数据管理技术不能很好地适应语义网应用的需要。面向在线分析的语义网数据存储系统DBLink为高效的查询分析语义网数据而设计。为获得更快的存取速度,将整个数据集组织存储在主存中,并使用多种优化方式;对语义网数据按照数据类型进行分割组织,并将多值属性成组存贮,再映射回语义网的图模型视图;针对语义网上层应用的主要需求为查询、检索、分析等读操作,在底层设计上优先优化读操作的性能。查询接口使用基于图的查询表达式,其功能可以概括为抽取语义图的一个子图,或者对子图进行分析操作;提供路径选取、节点...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题的研究意义
1.2 国内外研究现状
1.3 课题背景和研究内容
1.4 论文的组织
2 DBLink语义网数据存储管理系统的设计
2.1 DBLink系统的主要设计思想
2.2 DBLink的体系结构
2.3 DBLink的工作流程
2.4 本章小结
3 语义网数据存储与查询技术
3.1 语义网数据的分割与重组
3.2 语义网数据模型与底层存储的映射
3.3 语义网数据的查询
3.4 本章小结
4 DBLink语义网数据存储管理系统的实现
4.1 缓冲区管理与持久化机制
4.2 数据表与索引
4.3 URI映射与内置数据类型支持
4.4 语义查询主要实现技术
4.5 本章小结
5 系统测试与分析
5.1 SemreX测试数据集
5.2 测试环境
5.3 功能测试
5.4 性能测试
5.5 本章小结
6 总结及未来的工作
致谢
参考文献
本文编号:3664502
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题的研究意义
1.2 国内外研究现状
1.3 课题背景和研究内容
1.4 论文的组织
2 DBLink语义网数据存储管理系统的设计
2.1 DBLink系统的主要设计思想
2.2 DBLink的体系结构
2.3 DBLink的工作流程
2.4 本章小结
3 语义网数据存储与查询技术
3.1 语义网数据的分割与重组
3.2 语义网数据模型与底层存储的映射
3.3 语义网数据的查询
3.4 本章小结
4 DBLink语义网数据存储管理系统的实现
4.1 缓冲区管理与持久化机制
4.2 数据表与索引
4.3 URI映射与内置数据类型支持
4.4 语义查询主要实现技术
4.5 本章小结
5 系统测试与分析
5.1 SemreX测试数据集
5.2 测试环境
5.3 功能测试
5.4 性能测试
5.5 本章小结
6 总结及未来的工作
致谢
参考文献
本文编号:3664502
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3664502.html