分布式计算环境下海量RDF数据的skyline查询研究
发布时间:2017-05-24 09:20
本文关键词:分布式计算环境下海量RDF数据的skyline查询研究,由笔耕文化传播整理发布。
【摘要】:随着语义网的提出和相关技术的发展与成熟,该领域吸引了学术界、政府部门和工业界的广泛关注和积极参与。关联数据作为语义网的最佳实践,越来越成为研究的热点。资源描述框架RDF现已成为关联数据的实际标准,为网络上的资源提供了一种资源描述标准。通过给万维网上的文档添加计算机能够理解和处理的形式化语义信息,大大提高信息检索的精度和效率。随着RDF数据的不断增多,针对RDF数据的信息挖掘成为数据管理和数据挖掘的研究热点。Skyline查询作为一种典型的多目标优化查询,为用户决策提供参考依据,因而得到了广泛研究。本论文主要研究针对海量RDF数据的Skyline查询。第一,根据RDF垂直存储的方式设计一种候选Skyline点筛选策略,提前修剪部分非Skyline元组,减少skyline支配点计算的数据量;并且在筛选的基础上给出基于MapReduce的Skyline并行化查询算法以提高查询效率。第二,针对高维数据空间下Skyline查询的不足,研究K-支配Skyline查询算法。论文提出两种K-支配查询算法。一种基于支配能力的K-支配查询算法,根据每个数据点的支配能力划分数据块,分别计算局部K-支配点,最后合并计算最终的K-支配点。另一种基于空间划分的K-支配查询算法,通过挖掘数据空间和K-支配的关系,计算支配集合。最后,本论文在大量数据的基础上进行实验,验证所提算法的计算效率。实验结果表明,与现有的Skyline查询算法和K-支配Skyline查询算法相比,本文提出的基于MapReduce的RDF数据Skyline查询算法和K-支配Skyline查询算法有效的提高查询效率。
【关键词】:Skyline查询 RDF数据 K-支配Skyline查询 MapReduce框架 云计算
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.4;TP311.13
【目录】:
- 摘要4-5
- Abstract5-12
- 1 绪论12-19
- 1.1 研究背景12-13
- 1.2 研究现状13-17
- 1.2.1 Skyline查询的研究现状13-16
- 1.2.2 RDF数据的研究现状16-17
- 1.3 本文的主要研究内容17-18
- 1.4 论文的组织结构18-19
- 2 相关技术研究19-29
- 2.1 Skyline查询19-22
- 2.1.1 单Skyline查询处理算法19-21
- 2.1.2 多Skyline查询处理算法21
- 2.1.3 不同应用环境的Skyline查询算法21-22
- 2.1.4 海量数据的Skyline查询22
- 2.2 K-支配Skyline查询算法22-24
- 2.3 RDF数据24-25
- 2.4 MapReduce计算框架25-28
- 2.5 本章小结28-29
- 3 RDF数据的Skyline优化查询机制29-39
- 3.1 概念描述29
- 3.2 RDF数据存储结构分析29-32
- 3.3 RDF数据筛选策略32-34
- 3.3.1 相关定义32-33
- 3.3.2 筛选策略及证明33-34
- 3.4 基于MapReduce的Skyline查询算法34-38
- 3.4.1 属性连接和数据筛选34-36
- 3.4.2 支配点计算36-38
- 3.5 本章小结38-39
- 4 RDF数据的K-支配Skyline算法研究39-52
- 4.1 K-支配Skyline查询引入39-40
- 4.2 概念描述40-41
- 4.3 K-支配特性41-42
- 4.3.1 K-支配的循环支配情况41-42
- 4.3.2 K-支配的支配关系的不传递性42
- 4.4 基于支配能力的K-支配算法42-45
- 4.4.1 筛选策略42-43
- 4.4.2 基于支配能力的K-支配查询算法43-45
- 4.5 基于空间划分的K-支配算法45-51
- 4.5.1 划分子空间原理45-49
- 4.5.2 基于空间划分的K-支配Skyline算法并行化实现49-51
- 4.6 本章小结51-52
- 5 实验及结果分析52-56
- 5.1 实验数据和实验环境52
- 5.2 实验分析52-55
- 5.2.1 RDF数据的Skyline优化查询机制实验52-54
- 5.2.2 RDF数据的K-支配Skyline查询算法实验54-55
- 5.3 本章小结55-56
- 6 总结与展望56-58
- 6.1 总结56-57
- 6.2 展望57-58
- 参考文献58-61
- 致谢61-62
- 个人简历62
- 在读期间发表的论文及参与的项目62
- 发表论文62
- 参与项目62
【参考文献】
中国期刊全文数据库 前4条
1 孙圣力;戴东波;黄震华;张齐勋;周立新;;概率数据流上Skyline查询处理算法[J];电子学报;2009年02期
2 雷婷;王涛;曲武;韩晓光;;云环境下基于超球面投影分区的Skyline计算[J];计算机科学;2013年06期
3 潘立强;李建中;骆吉洲;;无线传感器网络中一种近似Skyline查询处理算法[J];软件学报;2010年05期
4 杨艳艳;赵雷;杨季文;;改进的概率数据流上Skyline查询算法[J];苏州大学学报(工科版);2012年02期
本文关键词:分布式计算环境下海量RDF数据的skyline查询研究,,由笔耕文化传播整理发布。
本文编号:390404
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/390404.html