偏序域上skyline查询处理技术的优化
发布时间:2024-01-25 09:17
随着互联网技术与数据库技术的发展,信息采集设备与技术的进步,近些年来,互联网数据日益复杂庞大,因此,如何帮助用户从这些海量、庞杂的信息中挖掘出最有价值的信息越来越成为学术界研究关心的热点。skyline查询可以根据用户的需求,从复杂庞大的互联网数据中迅速挖掘出用户真正关心的数据资源,在许多实际应用中有着十分重要的作用。但目前绝大多数的skyline算法都关注于全序域上的数据查询,适用于偏序域上的算法较少,且计算效率不能很好的适应用户日益增长的需求。因此,高效地处理偏序域上的skyline查询是一个极具现实意义的问题。针对以上问题,本文对偏序域上的skyline查询问题展开研究,提出了有效地提高查询效率的方法,具体地,本文主要贡献如下:(1)提出将倒排索引引入skyline查询领域,倒排索引将每个偏好维度上的属性按从优至劣进行排序,减少大量的冗余计算,从而提高计算效率。(2)提出了 PSP-B算法,解决了传统算法对每次计算都对整个数据集进行扫描的问题。算法对数据集在每个维度上建立倒排索引,通过循环扫描策略快速找到扫描结束点来结束算法,这样达到了对数据集过滤剪枝的目的,提高了计算效率。(3...
【文章页数】:59 页
【学位级别】:硕士
本文编号:3884548
【文章页数】:59 页
【学位级别】:硕士
图2.2偏序域上的skyline查询举例??Fig.?2.2?The?example?of?skyline?for?partially?ordered?domains??
图3.1全序域上的倒排索引举例??Fig.?3.1?Examples?of?the?Inverted?Index?on?Total?order?domains??3.3偏序映射??
图3.3倒排索引应用举例(用户w3)??Fig.?3.3?The?example?of?the?inverted?index?application??-13?-??
图3.4维度允上的结果集举例(用户t/3)??Fig.?3.4?The?example?of?result?set?on?domain?Rl??t??3.5算法描述??
本文编号:3884548
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3884548.html