针对大数据集的Top-k Skyline查询算法研究
发布时间:2022-11-01 18:57
Skyline查询算法,从被提出以来,就得到了大量的关注。该算法能够很好地描绘数据的概况,展现数据的走向。Skyline查询算法在多规则决策、实时在线服务以及商业数据分析等等的实际场景中都用着良好的应用。并且在互联网技术日新月异的时代,Skyline查询算法依然拥有可观的发展潜力。然而,在处理维数多、数据量大的数据集的时候,Skyline查询算法存在着返回结果过多的问题。因此结合经典的Top-k算法来帮助过滤Skyline查询的结果的Top-k Skyline查询算法被提出了。但是现有的Top-k Skyline查询算法在处理大数据集的时候,仍然存在效率低下的问题,主要表现在以下几个方面:(1)通过构建以及维护特殊的数据结构来减少查询时间。但是在处理大数据集时,存储相关数据结构的所需空间以及维护数据结构的所需时间,随着数据量爆炸式增加而变得难以接受。(2)时间复杂度较大。现有算法最优时间复杂度为O(nlogn),在处理大数据集的时候,算法的运行时间过长。(3)特殊的数据结构缺乏普适性。在处理数据类型简单的数据集时,构建相匹配的数据结构能做到良好的时间优化。但是面对数据类型复杂的数据集时...
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 本文结构
第二章 经典的Top-k Skyline查询算法
2.1 Skyline查询算法
2.2 Top-k支配查询算法
2.3 多级网格Skyline查询算法
2.4 针对大数据集设计新的Top-k Skyline查询算法的必要性
2.5 针对大数据集设计新的Top-k Skyline查询算法要考虑的因素
2.6 本章小结
第三章 基于度值评分的Top-k Skyline查询算法
3.1 DFTS算法基本思想
3.2 DFTS算法整体流程
3.3 DFTS算法实例
3.4 性能分析
3.5 本章小结
第四章 实验设计与结果
4.1 实验设计
4.2 评估DFTS算法性能的影响因素
4.3 DFTS与TKDQ的对比
4.4 DFTS在不同规模数据集中的收益分析
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 后续工作
参考文献
攻读硕士学位期间发表的论文
致谢
本文编号:3699920
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 本文结构
第二章 经典的Top-k Skyline查询算法
2.1 Skyline查询算法
2.2 Top-k支配查询算法
2.3 多级网格Skyline查询算法
2.4 针对大数据集设计新的Top-k Skyline查询算法的必要性
2.5 针对大数据集设计新的Top-k Skyline查询算法要考虑的因素
2.6 本章小结
第三章 基于度值评分的Top-k Skyline查询算法
3.1 DFTS算法基本思想
3.2 DFTS算法整体流程
3.3 DFTS算法实例
3.4 性能分析
3.5 本章小结
第四章 实验设计与结果
4.1 实验设计
4.2 评估DFTS算法性能的影响因素
4.3 DFTS与TKDQ的对比
4.4 DFTS在不同规模数据集中的收益分析
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 后续工作
参考文献
攻读硕士学位期间发表的论文
致谢
本文编号:3699920
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3699920.html