大型社交网络的差分隐私保护算法
发布时间:2024-05-19 17:15
为解决大型社交网络隐私保护中的复杂度过高及可用性差的问题,提出一种基于随机投影及差分隐私的社交网络隐私保护算法。利用随机投影对社交网络图的邻接矩阵进行指定投影数量的降维,进一步在降维后的矩阵中加入少量高斯噪声生成待发布矩阵。该算法满足(ε,δ)-差分隐私定义且能保持用户间欧氏距离的可计算性不变。实验和对比分析结果表明,该算法较传统差分隐私能大幅提升数据可用性且计算复杂性较小,适用于大规模社交网络隐私保护。
【文章页数】:7 页
【部分图文】:
本文编号:3978207
【文章页数】:7 页
【部分图文】:
图1社交网络图G
社交网络图表示用户个体以及用户个体之间的关系,设G=(V,{E})是一个表示社交网络连通性的二元图,V在图中的数据元素称为顶点V={v1,v2,…,vn},代表社交网络图中用户节点集合,{E}是用户节点之间边的集合,社交网络中用户节点数目为n=|V|。图1是简单的社交网络图。社交....
图2用户间欧式距离变化对比
为了验证RP-DP算法在不同隐私保护水平下,对社交网络用户间欧式距离的影响,实验1从BitcoinOTC数据集中随机采样选取100个用户,并计算用户间原始欧式距离、经RP-DP算法在不同隐私保护水平下扰动后的欧式距离。该实验中,将BitcoinOTC数据集降维至500维(m=....
图3不同隐私保护算法发布数据集相对原始数据集谱聚类的NMI对比(m=500)
实验2对BitcoinOTC数据集分别通过差分隐私算法[15]和RP-DP算法(m=500)保护后的发布数据集进行谱聚类(聚8类)对比,实验以BitcoinOTC数据集不做变化直接聚类的结果作为标准划分,与两种发布数据集的聚类结果对比,计算标准化互信息(normalized....
图4RP-DP算法不同投影数量的发布数据集相对原始数据集谱聚类的NMI对比
为了评估RP-DP算法中投影数量对数据可用性影响,实验3将BitcoinOTC数据集通过RP-DP算法降至不同维度,并调整差分隐私预算大小进行对比,结果如图4所示。图4是利用RP-DP算法对BitcoinOTC数据集降至100-1000维度并添加不同差分隐私保护水平ε=0.6....
本文编号:3978207
本文链接:https://www.wllwen.com/kejilunwen/yysx/3978207.html