当前位置:主页 > 科技论文 > 软件论文 >

面向频繁项集和高效用项集挖掘的隐私保护方法研究

发布时间:2022-12-10 23:13
  随着电子信息技术的迅猛发展,人们获取并存储数据的成本显著降低,处理数据的能力得到了极大的提升。数据挖掘作为一种能够有效地挖掘数据中有用信息的技术手段,在近几年得到了广泛的研究和应用。其中,旨在发现高价值模式的频繁项集挖掘及其衍生技术在大规模数据集的知识挖掘任务中扮演着越来越重要的角色。然而,敏感的高价值项集在数据集公开或共享的过程中面临着被泄露的风险。因此,如何在数据的使用者发生变化时保护敏感项集的隐私安全,已经成为一个亟待解决的重要研究课题。近年来,学者们基于不同的理论和技术提出了各种面向高价值项集挖掘的隐私保护方法。但这些方法在完成隐藏敏感频繁项集或高效用项集任务的同时,都对数据集本身所具有的实用性造成了不同程度的损害,包括重要信息的丢失和错误信息的产生。因而,尽可能地在对数据集实施隐私保护策略的过程中保留数据实用性是该课题的另一个侧重点。目前,对于这个已证明为NP难的问题,已提出的解决方法都无法很好地将数据实用性损失降低至一个较理想的水平。为此,针对频繁项集挖掘及其衍生的高效用项集挖掘中存在的隐私泄露问题,论文分别提出了两类新的模型:基于数据集重构的频繁项集隐私保护模型和基于整数... 

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 引言
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 面向频繁项集挖掘的隐私保护
        1.2.2 面向高效用项集挖掘的隐私保护
    1.3 研究的主要内容
        1.3.1 隐私保护频繁项集挖掘
        1.3.2 隐私保护高效用项集挖掘
    1.4 论文的结构
第二章 准备工作及相关概念
    2.1 频繁项集挖掘的相关概念
    2.2 高效用项集挖掘的相关概念
    2.3 隐私保护项集挖掘的相关概念
    2.4 本章小结
第三章 基于数据集重构的隐私保护频繁项集挖掘模型
    3.1 模型整体框架
    3.2 模型主要步骤
        3.2.1 预清洗
        3.2.2 反向频繁项集挖掘
        3.2.3 数据集扩展
        3.2.4 进一步隐藏策略
    3.3 实验仿真与分析
        3.3.1 实验准备
        3.3.2 数据实用性
        3.3.3 运行时间
    3.4 本章小结
第四章 基于整数线性规划的隐私保护高效用项集挖掘模型
    4.1 模型整体框架
    4.2 模型主要步骤
        4.2.1 SHI表和NHI表的构建
        4.2.2 预处理
        4.2.3 约束满足问题的构建
    4.3 实验仿真与分析
        4.3.1 实验准备
        4.3.2 数据实用性
        4.3.3 运行时间
    4.4 本章小结
第五章 总结与展望
    5.1 本论文总结
    5.2 下一步的工作思路
参考文献
致谢
攻读硕士期间已发表的论文
攻读硕士期间参加的科研项目



本文编号:3717694

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3717694.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1f0c6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com