面向数据挖掘的隐私保护及应用研究
发布时间:2021-01-27 17:53
科学技术的迅猛发展使得人们的生活越来越便利,与此同时,日益剧增的数据量加大了人们获取信息的难度。数据挖掘技术的兴起与发展有利于解决人们信息获取的难题,但是,数据挖掘的大规模应用正在严重危害着人们个人隐私数据的安全。人们享受数据挖掘带来的便利的同时,正在承担着个人隐私泄露的风险。面向数据挖掘的隐私保护技术的研究旨在保护人们隐私数据的同时进行有效的数据挖掘。综上所述,面向数据挖掘的隐私保护技术是一个亟待研究的课题。本文的主要研究工作如下:1.本文提出了一种基于k-means的差分隐私保护方法。此方法首先将原始数据集去除孤立点,其次根据数据集的平均密度确定初始聚类中心,然后按照已经确定的初始聚类中心对数据集进行聚类及匿名处理,最后将噪声数据添加到经过处理的数据集中。由于经过聚类匿名处理后的数据集能够有效减少查询函数的敏感度,从而降低拉普拉斯噪声的添加量,所以基于k-means的差分隐私保护能够很大程度上提高数据的可用性。2.本文在基于泛化的差分隐私匿名算法(Differentially-private anonymization algorithm based on Generalizati...
【文章来源】:南京信息工程大学江苏省
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 论文研究背景及意义
1.2 研究现状
1.3 论文组织架构
第二章 相关技术介绍
2.1 数据挖掘
2.2 聚类
2.3 个性化推荐
2.4 差分隐私保护技术
2.5 面向数据挖掘的隐私保护算法
2.5.1 基于数据失真的面向数据挖掘的隐私保护算法
2.5.2 基于数据加密的面向数据挖掘的隐私保护算法
2.5.3 基于限制发布的面向数据挖掘的隐私保护算法
2.6 本章小结
第三章 基于差分隐私保护的k-means匿名化算法
3.1 基于k-means的匿名化算法
3.2 改进的基于k-means的匿名化算法
3.3 基于差分隐私保护的k-means匿名化算法
3.4 实验分析
3.4.1 实验环境
3.4.2 评价指标
3.4.3 实验结果与分析
3.5 本章小结
第四章 改进的基于DiffGen的隐私保护算法
4.1 DiffGen算法
4.2 DiffGen算法的改进
4.2.1 细分方案的选择
4.2.2 可用性函数
4.2.3 隐私预算的分配
4.3 实验分析
4.3.1 实验环境
4.3.2 评价指标
4.3.3 实验结果与分析
4.4 本章小结
第五章 隐私保护在个性化推荐中的应用
5.1 应用背景
5.2 面向个性化推荐的隐私保护算法
5.2.1 面向个性化推荐的数据发布算法
5.2.2 基于隐私保护的个性化推荐算法
5.3 实验分析
5.3.1 实验数据集
5.3.2 评价指标
5.3.3 实验结果与分析
5.4 本章小结
第六章 总结与展望
6.1 工作总结
6.2 展望
致谢
参考文献
作者简介
【参考文献】:
期刊论文
[1]面向差分隐私保护的聚类算法[J]. 胡闯,杨庚,白云璐. 计算机科学. 2019(02)
[2]基于拉普拉斯机制的差分隐私保护k-means++聚类算法研究[J]. 傅彦铭,李振铎. 信息网络安全. 2019(02)
[3]个性化(α,l)-多样性k-匿名隐私保护模型[J]. 曹敏姿,张琳琳,毕雪华,赵楷. 计算机科学. 2018(11)
[4]面向位置大数据的差分隐私保护研究[J]. 张建坤,马永发,谢蔚. 软件导刊. 2018(11)
[5]数据相等问题的安全多方计算方案研究[J]. 窦家维,李顺东. 电子学报. 2018(05)
[6]同态加密在加密机器学习中的应用研究综述[J]. 崔建京,龙军,闵尔学,于洋,殷建平. 计算机科学. 2018(04)
[7]基于差分隐私的数据匿名化隐私保护方法[J]. 陈晓宇,韩斌,黄树成. 计算机技术与发展. 2018(07)
[8]一种个性化(p,k)匿名隐私保护算法[J]. 贾俊杰,闫国蕾. 计算机工程. 2018(01)
[9]融合集群度与距离均衡优化的K-均值聚类算法[J]. 王日宏,崔兴梅. 计算机应用. 2018(01)
[10]基于密度差分的自动聚类算法[J]. 陈朝威,常冬霞. 软件学报. 2018(04)
博士论文
[1]面向数据挖掘的隐私保护方法研究[D]. 李锋.上海交通大学 2008
本文编号:3003480
【文章来源】:南京信息工程大学江苏省
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 论文研究背景及意义
1.2 研究现状
1.3 论文组织架构
第二章 相关技术介绍
2.1 数据挖掘
2.2 聚类
2.3 个性化推荐
2.4 差分隐私保护技术
2.5 面向数据挖掘的隐私保护算法
2.5.1 基于数据失真的面向数据挖掘的隐私保护算法
2.5.2 基于数据加密的面向数据挖掘的隐私保护算法
2.5.3 基于限制发布的面向数据挖掘的隐私保护算法
2.6 本章小结
第三章 基于差分隐私保护的k-means匿名化算法
3.1 基于k-means的匿名化算法
3.2 改进的基于k-means的匿名化算法
3.3 基于差分隐私保护的k-means匿名化算法
3.4 实验分析
3.4.1 实验环境
3.4.2 评价指标
3.4.3 实验结果与分析
3.5 本章小结
第四章 改进的基于DiffGen的隐私保护算法
4.1 DiffGen算法
4.2 DiffGen算法的改进
4.2.1 细分方案的选择
4.2.2 可用性函数
4.2.3 隐私预算的分配
4.3 实验分析
4.3.1 实验环境
4.3.2 评价指标
4.3.3 实验结果与分析
4.4 本章小结
第五章 隐私保护在个性化推荐中的应用
5.1 应用背景
5.2 面向个性化推荐的隐私保护算法
5.2.1 面向个性化推荐的数据发布算法
5.2.2 基于隐私保护的个性化推荐算法
5.3 实验分析
5.3.1 实验数据集
5.3.2 评价指标
5.3.3 实验结果与分析
5.4 本章小结
第六章 总结与展望
6.1 工作总结
6.2 展望
致谢
参考文献
作者简介
【参考文献】:
期刊论文
[1]面向差分隐私保护的聚类算法[J]. 胡闯,杨庚,白云璐. 计算机科学. 2019(02)
[2]基于拉普拉斯机制的差分隐私保护k-means++聚类算法研究[J]. 傅彦铭,李振铎. 信息网络安全. 2019(02)
[3]个性化(α,l)-多样性k-匿名隐私保护模型[J]. 曹敏姿,张琳琳,毕雪华,赵楷. 计算机科学. 2018(11)
[4]面向位置大数据的差分隐私保护研究[J]. 张建坤,马永发,谢蔚. 软件导刊. 2018(11)
[5]数据相等问题的安全多方计算方案研究[J]. 窦家维,李顺东. 电子学报. 2018(05)
[6]同态加密在加密机器学习中的应用研究综述[J]. 崔建京,龙军,闵尔学,于洋,殷建平. 计算机科学. 2018(04)
[7]基于差分隐私的数据匿名化隐私保护方法[J]. 陈晓宇,韩斌,黄树成. 计算机技术与发展. 2018(07)
[8]一种个性化(p,k)匿名隐私保护算法[J]. 贾俊杰,闫国蕾. 计算机工程. 2018(01)
[9]融合集群度与距离均衡优化的K-均值聚类算法[J]. 王日宏,崔兴梅. 计算机应用. 2018(01)
[10]基于密度差分的自动聚类算法[J]. 陈朝威,常冬霞. 软件学报. 2018(04)
博士论文
[1]面向数据挖掘的隐私保护方法研究[D]. 李锋.上海交通大学 2008
本文编号:3003480
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3003480.html