事务数据流关键模式挖掘的差分隐私保护方法
发布时间:2023-05-31 22:52
事务数据流下频繁模式挖掘是大多数在线数据挖掘应用中的一个最基础的工作。然而,在数据流上挖掘简洁的关键模式比频繁模式更有优势,因为关键模式既可以避免频繁模式里包含的冗余信息以减少内存存储空间,又可以高效无损地提取频繁模式。但是,由于连续时间戳发布的统计信息可以作为辅助知识增强攻击者的推理能力,所以从包含个人信息的事务数据流中挖掘关键模式比静态场景下更容易造成隐私泄露。然而,还没有工作涉及事务数据流连续发布挖掘的关键模式中的隐私保护问题,因此,本文在每个时间戳提出了一个实时的差分隐私关键模式计算算法(Real-time Differentially Private Crucial Pattern Computation,简称RDP-CPC),该算法在每个时间戳设计一个三阶段机制:预处理阶段、深入计算阶段和噪音挖掘阶段。该算法不仅能在满足关键模式连续发布的隐私的前提下,尽可能提高发布的关键模式统计信息的效用性;而且根据关键模式的特点,在不增加维护开销的情况下减少了平均挖掘时间。为了减少对关键模式计算算法(Crucial Pattern Computation,简称CPC)的调用次数,在三阶段...
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 研究现状及分析
1.3 本文的主要创新与结构安排
第2章 数据流模型、关键模式挖掘以及静态隐私保护方法概述
2.1 数据流模型
2.1.1 窗口模型
2.1.2 滑动窗口隐私预算分配方法
2.2 关键模式挖掘方法
2.2.1 频繁模式及关键模式的基本概念
2.2.2 事务数据流关键模式挖掘方法
2.3 静态场景下频繁模式挖掘的隐私保护方法
2.3.1 静态场景下频繁模式挖掘的隐私问题
2.3.2 差分隐私模型
2.4 本章小结
第3章 事务数据流关键模式挖掘的差分隐私保护方法
3.1 事务数据流关键模式挖掘的隐私问题描述
3.2 实现事务数据流实时的差分隐私关键模式计算算法的三个关键子算法
3.2.1 构造前缀树算法
3.2.2 前缀树调整算法
3.2.3 筛选关键模式候选集算法
3.3 子算法的隐私安全性以及复杂性分析
3.3.1 隐私安全性分析
3.3.2 复杂性分析
3.4 本章小结
第4章 事务数据流关键模式挖掘的差分隐私方法实现与评估
4.1 事务数据流每个时间戳的差分隐私关键模式计算算法系统框架
4.1.1 预处理阶段
4.1.2 深入计算阶段
4.1.3 噪音挖掘阶段
4.2 总算法的隐私安全性、效用性以及复杂性分析
4.2.1 隐私安全性分析
4.2.2 效用性分析
4.2.3 复杂性分析
4.3 本章小结
第5章 实验与分析
5.1 实验环境设置与数据集简介
5.1.1 系统环境设置
5.1.2 实验数据集
5.2 实验评价指标
5.3 实验结果与分析
5.3.1 参数W对效用性及挖掘时间的影响
5.3.2 参数ε对效用性及挖掘时间的影响
5.3.3 参数r对效用性及挖掘时间的影响
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士期间发表的与学位论文有关的论文目录
致谢
本文编号:3826160
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第1章 绪论
1.1 研究背景及意义
1.2 研究现状及分析
1.3 本文的主要创新与结构安排
第2章 数据流模型、关键模式挖掘以及静态隐私保护方法概述
2.1 数据流模型
2.1.1 窗口模型
2.1.2 滑动窗口隐私预算分配方法
2.2 关键模式挖掘方法
2.2.1 频繁模式及关键模式的基本概念
2.2.2 事务数据流关键模式挖掘方法
2.3 静态场景下频繁模式挖掘的隐私保护方法
2.3.1 静态场景下频繁模式挖掘的隐私问题
2.3.2 差分隐私模型
2.4 本章小结
第3章 事务数据流关键模式挖掘的差分隐私保护方法
3.1 事务数据流关键模式挖掘的隐私问题描述
3.2 实现事务数据流实时的差分隐私关键模式计算算法的三个关键子算法
3.2.1 构造前缀树算法
3.2.2 前缀树调整算法
3.2.3 筛选关键模式候选集算法
3.3 子算法的隐私安全性以及复杂性分析
3.3.1 隐私安全性分析
3.3.2 复杂性分析
3.4 本章小结
第4章 事务数据流关键模式挖掘的差分隐私方法实现与评估
4.1 事务数据流每个时间戳的差分隐私关键模式计算算法系统框架
4.1.1 预处理阶段
4.1.2 深入计算阶段
4.1.3 噪音挖掘阶段
4.2 总算法的隐私安全性、效用性以及复杂性分析
4.2.1 隐私安全性分析
4.2.2 效用性分析
4.2.3 复杂性分析
4.3 本章小结
第5章 实验与分析
5.1 实验环境设置与数据集简介
5.1.1 系统环境设置
5.1.2 实验数据集
5.2 实验评价指标
5.3 实验结果与分析
5.3.1 参数W对效用性及挖掘时间的影响
5.3.2 参数ε对效用性及挖掘时间的影响
5.3.3 参数r对效用性及挖掘时间的影响
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士期间发表的与学位论文有关的论文目录
致谢
本文编号:3826160
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3826160.html