云环境下抵抗边再识别的社会网络匿名技术研究
发布时间:2020-07-02 09:24
【摘要】:随着当前社会信息化的发展,多种类型社会网络的建立与使用,极大方便了人们交友、互动、交流、评论等一系列活动。用户使用社会网络是需要进行注册并提供个人信息,包括兴趣,职业或者收入状况等,甚至大部分还需要实名认证。社会网络的出现与发展为科学研究提供了一个很好的平台,去进行各种研究分析,诸如用户行为、社区形成等。然而社会网络数据的公开研究与发布却给用户个人信息的安全隐私带来极大的风险。因此,针对社会网络数据的隐私保护就显得尤为重要,甚至成为限制社会网络数据分析发展的瓶颈。同时,随着大数据时代的到来,社交网络中的用户数量也在与日俱增。传统的基于单工作站的社会网络分析和隐私保护技术已经不适合处理海量社会网络数据,单工作站的社会网络匿名算法的执行效率、数据处理能力均不能满足实际应用需求。因此,并行化社会网络隐私保护技术成为研究热点;另一方面,现有的隐私保护方法不能抵御攻击者同时以边的结构和属性信息作为背景知识发动的边再识别攻击,隐私保护强度不能满足实际需求。首先,为了提高社会网络中边隐私的保护强度和大规模社会网络匿名效率,提出了边信息k-匿名模型和分布并行匿名方法D-EIAM。该方法在分布并行处理系统Spark下,对社会网络中边进行并行贪心分组,生成匿名边信息序列,然后基于分布并行图处理框架GraphX,通过并行添加伪结点和属性泛化生成匿名图,同时匿名保护边的属性与结构信息,达到隐私保护目标和高效率匿名大规模社会网络的目的。其次,为抵御动态社会网络中的边再识别攻击,提出k~m-NMF匿名模型,其中k代表隐私保护级别,m表示攻击者可以监视受害者的时间段。该模型确保在时间阈值m内社会网络中的边被识别的概率不大于1/k。最后,选用社会网络图数据集com-Youtube和论文数据集DBLP在分布式图数据处理集群上对提出的两种匿名算法的执行效率和数据可用性进行分析。实验结果表明,提出的两种匿名保护算法在高效率处理大规模社会网络数据的同时保证了匿名图数据的可用性。
【学位授予单位】:内蒙古科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.08
【学位授予单位】:内蒙古科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.08
【相似文献】
相关期刊论文 前10条
1 张玉志;唐晓嘉;;对社会网络中知识流动的逻辑研究[J];湖北大学学报(哲学社会科学版);2019年02期
2 李峰波;环靓;殷英;鲜逸飞;;基于社会网络的农民同乡帮带自雇创业模式研究——基于油篓村的案例分析[J];劳动保障世界;2019年18期
3 贺建风;陈茜儒;;认知能力、社会网络与创业选择[J];世界经济文汇;2019年04期
4 黄e
本文编号:2738025
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2738025.html