基于差分隐私的带权网络图数据的隐私保护
发布时间:2021-01-30 06:19
各种网络应用的出现给人们的生活带来了极大的便利,与此同时,用户的隐私问题也受到了越来越多的关注。网络数据通常采取图来表示,如社交网络图、商业贸易网络图等。这些图可能由节点、边及边上的权重组成,包含着大量的敏感信息,在对图发布前采取适当的隐私保护手段是很有必要的。目前,在网络图数据的隐私保护工作中,要么只是节点、边等结构的隐私保护,要么只是边权重的隐私保护,几乎都是单方面保护图数据的隐私。因此,本文采用差分隐私这一隐私保护模型对带权网络图数据进行隐私保护,提出相对有效的算法,实现同时保护网络图数据中边权重和结构的隐私。本文首先提出了带权图的隐私保护算法(WGPA)。边权重保护先于图的结构保护,二者是互相关联与影响的关系。在对图数据集中的边权重扰动时,采用的是差分隐私的Laplace机制进行扰动,为每个图中的边权重序列分配隐私预算,设计合理的隐私预算分配策略。考虑到图结构的复杂性,将图转化成编码模式,并在对图的编码过程中将扰动后的权重值融入其中;再利用频繁子图挖掘算法,在挖掘的过程中采用差分隐私的Laplace机制和指数机制对图的结构进行扰动和筛选,最终得到最为理想的噪音版的带权网络图数据...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2.2所示,一般??对这种复杂网络图的处理可能要先米用社区发现(Community?detection)来对图进行划??
?基于差分隐私的带权网络图数据的隐私保护???分,将图由一个复杂的结构,转化为一个个简单的图结构,对应于每个社区中。社区与??社区之间的联系通常要稀疏些,社区中的节点之间的联系要紧密一些。社区发现的相关??研宄中已有很多的算法被提出,相当于是对复杂图数据进行聚类操作。??图2.?2复杂的网络图数据??Fig.?2.2?Complex?network?graph?data??2.2数据的隐私性??在网络图数据中,图的节点、图的边,以及图的一些特性都是有可能造成用户的隐??私泄露[43-46】,以下是对图中涉及到的隐私问题进行介绍。??(1)图节点的隐私性??图的节点是某个个体或是组织的抽象,为了防止攻击者根据一些背景知识,推测出??用户是否存在于某些网络中,保护者会在数据发布的时候采取一些保护手段,如将节点??匿名化,删除节点的标识信息。这样一来,在发布图中的节点就可能是由与用户信息无??关的字符等信息表示,常用英文字符儿C..或是h,F2,?F3...等代替用户真实身份。??可是即使对节点匿名化,攻击者依然有对节点再识别的可能性,攻击者可以根据节点之??间关系等推测出节点的信息。因此,简单的匿名化保护是难以保证用户隐私不泄露,需??要在保护节点隐私时,也考虑节点之间的关系。??另外,这些节点的属性中也可能包含着用户的一些个人信息,如年龄、手机号码、??职业等信息。而用户是不希望他们的这些个人信息被发现的,通常称这些信息为用户的??敏感信息,这就需要对节点的属性进行隐私保护。因此,在图节点的隐私保护中,通常??可能涉及到节点的存在、节点再识别、节点的属性等隐私泄露。??(2)边的隐私性??-10?-??
更加灵活,整体严谨完整。序列组合性的??作用是保证隐私预算可以在方法的不同步骤进行分配,并且可以使得整个算法的设计满??足差分隐私。并行组合性的作用则是可以保证在对数据集划分成多个不相交的子数据集,??各个子数据集上的算法依然可以在整体上满足差分隐私。二者的定义分别如下:??定义2.5序列组合性:给定数据集以及在该数据集上设计的》个隐私算法??{瓜...4,...冰丨,若每个算法4(193?)满足^-差分隐私,则整个算法满足&差分隐私,??其中,£?=??序列组合性对应的图形表示如图2.3所示。??—?J?MiiA,?|—__输出?1?、??/?c?A'?最终的输出、??数?-pj?A2????>?输出?〇2?\?\\?结果??1?言、??D?\\\?算法木—- ̄ ̄>?输出?R?^?差??\vj????,/??—?算法4??>输出,??图2.?3序列组合性??Fig.?2.3?Sequential?Composition??-14?-??
【参考文献】:
期刊论文
[1]本地化差分隐私研究综述[J]. 叶青青,孟小峰,朱敏杰,霍峥. 软件学报. 2018(07)
[2]Embedding differential privacy in decision tree algorithm with different depths[J]. Xuanyu BAI,Jianguo YAO,Mingxuan YUAN,Ke DENG,Xike XIE,Haibing GUAN. Science China(Information Sciences). 2017(08)
[3]基于差分隐私的权重社会网络隐私保护[J]. 兰丽辉,鞠时光. 通信学报. 2015(09)
[4]差分隐私保护及其应用[J]. 熊平,朱天清,王晓峰. 计算机学报. 2014(01)
本文编号:3008416
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2.2所示,一般??对这种复杂网络图的处理可能要先米用社区发现(Community?detection)来对图进行划??
?基于差分隐私的带权网络图数据的隐私保护???分,将图由一个复杂的结构,转化为一个个简单的图结构,对应于每个社区中。社区与??社区之间的联系通常要稀疏些,社区中的节点之间的联系要紧密一些。社区发现的相关??研宄中已有很多的算法被提出,相当于是对复杂图数据进行聚类操作。??图2.?2复杂的网络图数据??Fig.?2.2?Complex?network?graph?data??2.2数据的隐私性??在网络图数据中,图的节点、图的边,以及图的一些特性都是有可能造成用户的隐??私泄露[43-46】,以下是对图中涉及到的隐私问题进行介绍。??(1)图节点的隐私性??图的节点是某个个体或是组织的抽象,为了防止攻击者根据一些背景知识,推测出??用户是否存在于某些网络中,保护者会在数据发布的时候采取一些保护手段,如将节点??匿名化,删除节点的标识信息。这样一来,在发布图中的节点就可能是由与用户信息无??关的字符等信息表示,常用英文字符儿C..或是h,F2,?F3...等代替用户真实身份。??可是即使对节点匿名化,攻击者依然有对节点再识别的可能性,攻击者可以根据节点之??间关系等推测出节点的信息。因此,简单的匿名化保护是难以保证用户隐私不泄露,需??要在保护节点隐私时,也考虑节点之间的关系。??另外,这些节点的属性中也可能包含着用户的一些个人信息,如年龄、手机号码、??职业等信息。而用户是不希望他们的这些个人信息被发现的,通常称这些信息为用户的??敏感信息,这就需要对节点的属性进行隐私保护。因此,在图节点的隐私保护中,通常??可能涉及到节点的存在、节点再识别、节点的属性等隐私泄露。??(2)边的隐私性??-10?-??
更加灵活,整体严谨完整。序列组合性的??作用是保证隐私预算可以在方法的不同步骤进行分配,并且可以使得整个算法的设计满??足差分隐私。并行组合性的作用则是可以保证在对数据集划分成多个不相交的子数据集,??各个子数据集上的算法依然可以在整体上满足差分隐私。二者的定义分别如下:??定义2.5序列组合性:给定数据集以及在该数据集上设计的》个隐私算法??{瓜...4,...冰丨,若每个算法4(193?)满足^-差分隐私,则整个算法满足&差分隐私,??其中,£?=??序列组合性对应的图形表示如图2.3所示。??—?J?MiiA,?|—__输出?1?、??/?c?A'?最终的输出、??数?-pj?A2????>?输出?〇2?\?\\?结果??1?言、??D?\\\?算法木—- ̄ ̄>?输出?R?^?差??\vj????,/??—?算法4??>输出,??图2.?3序列组合性??Fig.?2.3?Sequential?Composition??-14?-??
【参考文献】:
期刊论文
[1]本地化差分隐私研究综述[J]. 叶青青,孟小峰,朱敏杰,霍峥. 软件学报. 2018(07)
[2]Embedding differential privacy in decision tree algorithm with different depths[J]. Xuanyu BAI,Jianguo YAO,Mingxuan YUAN,Ke DENG,Xike XIE,Haibing GUAN. Science China(Information Sciences). 2017(08)
[3]基于差分隐私的权重社会网络隐私保护[J]. 兰丽辉,鞠时光. 通信学报. 2015(09)
[4]差分隐私保护及其应用[J]. 熊平,朱天清,王晓峰. 计算机学报. 2014(01)
本文编号:3008416
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3008416.html