基于多目标框架的敏感项集隐藏算法研究
发布时间:2021-12-22 21:27
数据挖掘技术旨在从海量数据库中发掘出潜在的重要知识。数据挖掘技术与日俱兴的同时,在挖掘过程中,私人或敏感知识被泄露出来的风险也越来越高。然而商业合作中数据共享是必不可少的一个环节,共享数据很可能泄露相关的敏感知识,最终造成数据所有者的重大的经济损失。因而,我们需要对共享数据进行恰当的处理,使得其能在尽量不影响正常数据挖掘的前提下,避免其中的敏感知识被泄露。本文主要解决频繁模式挖掘中的隐私保护问题,致力于保护数据中敏感的频繁项集,删除原始数据库中部分事务来降低敏感项集的频繁度,从而在数据挖掘的角度下达到隐藏它们的目的。遗憾的是隐藏敏感项集技术伴随着副作用的产生,已证为NP-hard问题,过去的一些方法主要的缺点在于仅仅考虑单一目标,只能求得局部最优解。此外,已有的基于演化计算算法的敏感项集隐藏方法严重依赖适应性函数中各个副作用的预设权重,预设权重的大小将严重影响实验结果。针对以上问题,本文主要采用基于多目标优化算法框架来解决问题。本文的主要研究内容和贡献如下:从全局优化角度出发,为了减少敏感项集隐藏算法清洗数据库所带来的副作用,本文提出pNSGA2DT算法来将敏感项集隐藏问题转化为多目标...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
频繁项集隐藏算法简易流程
本论文的组织架
哈尔滨工业大学工学硕士学位论文符合该情况的项集的频繁度即可。而最为特殊的情况 9,只要删除事满足 2-1 公式所示的安全界限,情况 9 中的项集就一定不会是更新数频繁项集。f≤ Su-Sl ×|D|Su 其中 Su是上界阈值与频繁项集挖掘的最小支持度相符,而 Sl是主要是作为 Pre-large 项集的最小支持度。|D|是原始数据库事务的数量果删除事务的数量满足公式 2-1 的情况,即数量低于安全界限(f)那中的项集就不可能成为频繁项集。由此算法计算复杂度将因不需要重挖掘原始数据库而降低。
本文编号:3547122
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
频繁项集隐藏算法简易流程
本论文的组织架
哈尔滨工业大学工学硕士学位论文符合该情况的项集的频繁度即可。而最为特殊的情况 9,只要删除事满足 2-1 公式所示的安全界限,情况 9 中的项集就一定不会是更新数频繁项集。f≤ Su-Sl ×|D|Su 其中 Su是上界阈值与频繁项集挖掘的最小支持度相符,而 Sl是主要是作为 Pre-large 项集的最小支持度。|D|是原始数据库事务的数量果删除事务的数量满足公式 2-1 的情况,即数量低于安全界限(f)那中的项集就不可能成为频繁项集。由此算法计算复杂度将因不需要重挖掘原始数据库而降低。
本文编号:3547122
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3547122.html