差分隐私图聚类与生成技术研究
发布时间:2021-09-07 12:38
随着信息技术的飞速发展和便携式移动互联设备的广泛使用,大量的个人用户数据被互联网服务商所广泛搜集,例如由各类App所产生的位置数据、社交网络数据、个人健康状态数据等等。这些数据的搜集一方面能使得服务提供商能为用户提供更好的个性化推荐服务,但另一方面也给用户隐私带来了前所未有的挑战,一旦数据泄露就可能会威胁到用户的财产甚至生命安全。最近几年频繁发生的大规模数据泄漏事件进一步加深了人们对用户隐私数据泄露方面的担忧。因此,如何在保证隐私数据安全的前提下充分挖掘并利用数据也已成了网络安全领域的一个研究热点。差分隐私技术可以精细量化隐私保护水平,又能在一定程度上保留数据的可用性,已成为隐私保护领域事实上的标准,得到了学术界和工业界的广泛关注。针对各种网络信息系统产生的大量图数据在实际应用中所面临的隐私泄露问题,本文主要研究了差分隐私下的图数据聚类和合成图生成技术,并取得以下成果:1.针对图数据聚类分析过程中的隐私泄露问题,以一个经典的图聚类算法SCAN(Structural Clustering Algorithm for Networks)为基础,通过定义相关图的边差分隐私,并合理测定计算图中...
【文章来源】:战略支援部队信息工程大学河南省
【文章页数】:45 页
【学位级别】:硕士
【部分图文】:
不同隐私预算对NMI值的影响
第三章基于结构相似度的差分隐私图聚类算法第19页果显著增加,ARI值和NMI值都可达80%左右。再随着隐私预算的增大,ARI值和NMI值都缓慢增加,DP-SCAN算法的聚类效果也随之缓慢增加。图3.3给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对ARI值的影响。我们可以看出,ARI值随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,ARI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。因为SCAN算法的适当邻域β值为0.7,邻域β值在0.5到0.8之间通常足以获得良好的聚类结果,然后在此时DP-SCAN算法加入隐私预算引入噪声机制会大大降低聚类效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值图3.3不同邻域对ARI值的影响图3.4给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对NMI值的影响。我们可以看出,NMI值同ARI值一样,都随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,NMI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值图3.4不同邻域对NMI值的影响综上所述,结合图3.3和图3.4的分析可知,当邻域β逐渐增大时,ARI值和NMI值都先减小后增大。当邻域β在0.5到0.8之间时,SCAN算法有良好的聚类效果,但引入噪声机制的DP-SCAN算法的聚类效果较差,评估指标ARI值和NMI值都较校3.5本章小结本章重点研究了基于结构相似度的差分隐私图聚类算法的设计问题。针对经典的图聚
第三章基于结构相似度的差分隐私图聚类算法第19页果显著增加,ARI值和NMI值都可达80%左右。再随着隐私预算的增大,ARI值和NMI值都缓慢增加,DP-SCAN算法的聚类效果也随之缓慢增加。图3.3给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对ARI值的影响。我们可以看出,ARI值随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,ARI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。因为SCAN算法的适当邻域β值为0.7,邻域β值在0.5到0.8之间通常足以获得良好的聚类结果,然后在此时DP-SCAN算法加入隐私预算引入噪声机制会大大降低聚类效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值图3.3不同邻域对ARI值的影响图3.4给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对NMI值的影响。我们可以看出,NMI值同ARI值一样,都随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,NMI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值图3.4不同邻域对NMI值的影响综上所述,结合图3.3和图3.4的分析可知,当邻域β逐渐增大时,ARI值和NMI值都先减小后增大。当邻域β在0.5到0.8之间时,SCAN算法有良好的聚类效果,但引入噪声机制的DP-SCAN算法的聚类效果较差,评估指标ARI值和NMI值都较校3.5本章小结本章重点研究了基于结构相似度的差分隐私图聚类算法的设计问题。针对经典的图聚
【参考文献】:
期刊论文
[1]基于边介数模型的差分隐私保护方案[J]. 黄海平,王凯,汤雄,张东军. 通信学报. 2019(05)
[2]Publishing Social Graphs with Differential Privacy Guarantees Based on wPINQ[J]. LI Xiaoye,YANG Jing,SUN Zhenlong,ZHANG Jianpei. Chinese Journal of Electronics. 2019(02)
[3]点差分隐私下图数据的度直方图发布方法[J]. 张宇轩,魏江宏,李霁,刘文芬,胡学先. 计算机研究与发展. 2019(03)
[4]基于差分隐私保护的社交网络发布图生成模型[J]. 王俊丽,柳先辉,管敏. 同济大学学报(自然科学版). 2017(08)
[5]基于差分隐私保护的DP-DBScan聚类算法研究[J]. 吴伟民,黄焕坤. 计算机工程与科学. 2015(04)
[6]差分隐私保护及其应用[J]. 熊平,朱天清,王晓峰. 计算机学报. 2014(01)
[7]差分隐私保护k-means聚类方法研究[J]. 李杨,郝志峰,温雯,谢光强. 计算机科学. 2013(03)
本文编号:3389562
【文章来源】:战略支援部队信息工程大学河南省
【文章页数】:45 页
【学位级别】:硕士
【部分图文】:
不同隐私预算对NMI值的影响
第三章基于结构相似度的差分隐私图聚类算法第19页果显著增加,ARI值和NMI值都可达80%左右。再随着隐私预算的增大,ARI值和NMI值都缓慢增加,DP-SCAN算法的聚类效果也随之缓慢增加。图3.3给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对ARI值的影响。我们可以看出,ARI值随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,ARI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。因为SCAN算法的适当邻域β值为0.7,邻域β值在0.5到0.8之间通常足以获得良好的聚类结果,然后在此时DP-SCAN算法加入隐私预算引入噪声机制会大大降低聚类效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值图3.3不同邻域对ARI值的影响图3.4给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对NMI值的影响。我们可以看出,NMI值同ARI值一样,都随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,NMI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值图3.4不同邻域对NMI值的影响综上所述,结合图3.3和图3.4的分析可知,当邻域β逐渐增大时,ARI值和NMI值都先减小后增大。当邻域β在0.5到0.8之间时,SCAN算法有良好的聚类效果,但引入噪声机制的DP-SCAN算法的聚类效果较差,评估指标ARI值和NMI值都较校3.5本章小结本章重点研究了基于结构相似度的差分隐私图聚类算法的设计问题。针对经典的图聚
第三章基于结构相似度的差分隐私图聚类算法第19页果显著增加,ARI值和NMI值都可达80%左右。再随着隐私预算的增大,ARI值和NMI值都缓慢增加,DP-SCAN算法的聚类效果也随之缓慢增加。图3.3给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对ARI值的影响。我们可以看出,ARI值随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,ARI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。因为SCAN算法的适当邻域β值为0.7,邻域β值在0.5到0.8之间通常足以获得良好的聚类结果,然后在此时DP-SCAN算法加入隐私预算引入噪声机制会大大降低聚类效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值图3.3不同邻域对ARI值的影响图3.4给出了在隐私预算=10,阈值μ=5时,不同数据集上邻域β对NMI值的影响。我们可以看出,NMI值同ARI值一样,都随着邻域β的增大而先减小后增大。当邻域β=0.6左右时,NMI值达到最小值,DP-SCAN算法的聚类结果与SCAN算法的聚类结果相差较大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值图3.4不同邻域对NMI值的影响综上所述,结合图3.3和图3.4的分析可知,当邻域β逐渐增大时,ARI值和NMI值都先减小后增大。当邻域β在0.5到0.8之间时,SCAN算法有良好的聚类效果,但引入噪声机制的DP-SCAN算法的聚类效果较差,评估指标ARI值和NMI值都较校3.5本章小结本章重点研究了基于结构相似度的差分隐私图聚类算法的设计问题。针对经典的图聚
【参考文献】:
期刊论文
[1]基于边介数模型的差分隐私保护方案[J]. 黄海平,王凯,汤雄,张东军. 通信学报. 2019(05)
[2]Publishing Social Graphs with Differential Privacy Guarantees Based on wPINQ[J]. LI Xiaoye,YANG Jing,SUN Zhenlong,ZHANG Jianpei. Chinese Journal of Electronics. 2019(02)
[3]点差分隐私下图数据的度直方图发布方法[J]. 张宇轩,魏江宏,李霁,刘文芬,胡学先. 计算机研究与发展. 2019(03)
[4]基于差分隐私保护的社交网络发布图生成模型[J]. 王俊丽,柳先辉,管敏. 同济大学学报(自然科学版). 2017(08)
[5]基于差分隐私保护的DP-DBScan聚类算法研究[J]. 吴伟民,黄焕坤. 计算机工程与科学. 2015(04)
[6]差分隐私保护及其应用[J]. 熊平,朱天清,王晓峰. 计算机学报. 2014(01)
[7]差分隐私保护k-means聚类方法研究[J]. 李杨,郝志峰,温雯,谢光强. 计算机科学. 2013(03)
本文编号:3389562
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3389562.html