基于本地差分隐私下频繁模式挖掘关键技术研究
发布时间:2023-03-04 16:14
近年来,随着信息技术的快速发展,个人和企业产生了大量的数据信息。为了向用户提供更好的个性化服务,各种社交组织更加热衷于收集和分析用户数据。但是用户数据中通常包含个人敏感信息,直接发布和分析会导致用户隐私的泄露,从而给用户安全带来威胁。保护用户隐私常用的方法有匿名化、数据加密、差分隐私等,但这些方法存在无法防范具有任意背景知识者的攻击问题或者不可抵御来自不可信第三方收集者的攻击问题。为了解决这些问题,出现了本地差异隐私保护模型,该模型能够保证除用户自身外其他任何人无法准确获取用户的真实信息。频繁项挖掘是数据挖掘中的一个重要研究工作,其挖掘结果可以应用到预测商品未来销售趋势等服务当中。针对在本地差分隐私模型下现有的频繁项挖掘技术都是基于简单的单值数据类型上做的,本文在较复杂的键值对类型上进行频繁项挖掘。根据‘键’和‘值’的敏感情况,采用不同的方法进行挖掘。其中当‘键’和‘值’均敏感情况下使用部分扰动和截断来实现更高的挖掘精度。实验结果表明,上述方法在分布精度方面优于竞争对手方法。频繁序列模式挖掘是本文的另一个重要的挖掘对象。对于序列型数据,本文提出了在本地差分隐私模型下使用前缀树结构的LD...
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
主要符号表
1 引言
1.1 研究背景和意义
1.2 国内外研究状况
1.2.1 本地差分隐私下单值数据频率统计技术研究现状
1.2.2 本地差分隐私下多值数据频率统计技术研究现状
1.2.3 研究现状分析
1.3 研究内容
1.4 论文组织结构
1.5 论文主要贡献
2 基础理论
2.1 序列数据概念
2.2 频繁模式挖掘
2.2.1 频繁模式挖掘相关概念
2.2.2 频繁模式挖掘相关技术
2.3 隐私保护技术
2.3.1 匿名化技术
2.3.2 数据加密技术
2.3.3 差分隐私技术
2.3.4 本地差分隐私技术
3 基于本地差分隐私的频繁项挖掘算法研究
3.1 引言
3.2 基于键值对数据的隐私频繁项挖掘算法描述
3.2.1 问题描述与解决方案
3.2.2 方法综述
3.2.3 关键技术与理论证明
3.3 实验仿真
3.3.1 实验环境与数据
3.3.2 实验结果与分析
3.4 本章小结
4 基于本地差分隐私的频繁序列挖掘算法研究
4.1 引言
4.2 频繁序列挖掘算法描述
4.2.1 问题描述和解决方案
4.2.2 方法综述
4.2.3 频繁序列挖掘关键技术
4.2.4 算法误差分析
4.3 实验仿真
4.3.1 实验环境与数据
4.3.2 实验结果与分析
4.4 本章小结
5 总结与展望
5.1 论文总结
5.2 进一步的工作
参考文献
攻读学位期间科研成果
致谢
本文编号:3754593
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
主要符号表
1 引言
1.1 研究背景和意义
1.2 国内外研究状况
1.2.1 本地差分隐私下单值数据频率统计技术研究现状
1.2.2 本地差分隐私下多值数据频率统计技术研究现状
1.2.3 研究现状分析
1.3 研究内容
1.4 论文组织结构
1.5 论文主要贡献
2 基础理论
2.1 序列数据概念
2.2 频繁模式挖掘
2.2.1 频繁模式挖掘相关概念
2.2.2 频繁模式挖掘相关技术
2.3 隐私保护技术
2.3.1 匿名化技术
2.3.2 数据加密技术
2.3.3 差分隐私技术
2.3.4 本地差分隐私技术
3 基于本地差分隐私的频繁项挖掘算法研究
3.1 引言
3.2 基于键值对数据的隐私频繁项挖掘算法描述
3.2.1 问题描述与解决方案
3.2.2 方法综述
3.2.3 关键技术与理论证明
3.3 实验仿真
3.3.1 实验环境与数据
3.3.2 实验结果与分析
3.4 本章小结
4 基于本地差分隐私的频繁序列挖掘算法研究
4.1 引言
4.2 频繁序列挖掘算法描述
4.2.1 问题描述和解决方案
4.2.2 方法综述
4.2.3 频繁序列挖掘关键技术
4.2.4 算法误差分析
4.3 实验仿真
4.3.1 实验环境与数据
4.3.2 实验结果与分析
4.4 本章小结
5 总结与展望
5.1 论文总结
5.2 进一步的工作
参考文献
攻读学位期间科研成果
致谢
本文编号:3754593
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3754593.html