基于局部差分隐私的关联数据发布保护
发布时间:2021-01-09 00:08
局部差分隐私是隐私保护数据发布领域中最强大的隐私保证模型之一。然而,该模型目前主要用于单属性数据采集,关于多属性关联的数据发布研究很少。此外,当数据属性值在数据发布中独立扰动时,可能会导致过多的信息损失。因此,基于局部差分隐私的关联数据发布保护研究已成为一个需要解决的迫切问题。首先,针对隐私保护数据发布中属性间关联性被忽略的问题,本文提出构造κ-度私有贝叶斯网络的算法。该算法将互信息与贪婪算法相结合以构造具有最大互信息属性对的κ-度私有贝叶斯网络,并利用贝叶斯网络来提供属性间关联性的直观模型。具体地,通过互信息来量化属性间的关联强弱,并在尼值的限制下贪婪的选择最大的互信息属性对以构造低度贝叶斯网络模型。其次,针对数据发布中属性独立扰动时信息损失过多的问题,本文提出一种用于关联数据扰动的局部差分私有方法。该方法结合属性分组思想和随机响应技术,以实现对原始数据集的扰动。具体地,本文采取基于属性对最大平均互信息值的分组思想,该思想通过计算κ-度私有贝叶斯网络父子节点间的平均互信息作为当前属性组的互信息值。接着,设定阈值,将整个贝叶斯网络的属性分为两个类别,即,弱关联属性集和健壮的关联属性集。...
【文章来源】:安徽理工大学安徽省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
图2.1通用的差分隐私保护模型??
。,通常会产生更多噪音。??斯网络??网络是有向无环图,其具有每个节点的概率分布。每个点之间的弧表示概率依懒性。通常在给定分配给其它节可用于计算下一个节点的条件概率,因此,贝叶斯网络以用于衡量属性之间的相关性。当从数据集学习贝叶斯表示数据集的数据属性。??包含d个属性的数据集,分别为4,土...4心因此,定一组d个父子属性(AP)对,即,〇4丨,户1),(^2,户2),...,(4个石是乂中的唯一属性;??个乃是羔的父集合,包括X中的一些属性;??于任何贝叶斯网络中没有从為到4的边缘,斯网络是非循环的。??
SS?(Race,?Country,?Education,?Workclass,Occupation)和弱集合?WS?(Race)。本文为??鲁棒关联属性集ss执行局部差分隐私预算为的隐私保护,为弱关联属性集ws??执行预算为ft的隐私保护,因此构建的h度私有贝叶斯网络BN如图下图5.1所??不。??^^.ace^ ̄ ̄0.014856->^^ucation)--0.336405+<OccupatiOT|??0.139517?^?£:?、#?2??(Country)—0.012541->nVorkclass)--0.017104-^f?Income?)??图5.1基于成人数据集六个属性的h度私有贝叶斯网络BN??Fig.5.1?A?A:-degree?private?Bayesian?network?BN?over?six?attributes?of?the?Adult?data?set?DS??为了分析h度私有贝叶斯网络BN的分类效果,从两个类别上进行评估,分??别是预测个体是否是白人,以及年收入是否超过50K。另一个方面,将数据集分??为六个等级,即Z=(1K,2K,?4K,8K,16K,32K),其中1K=1000。数据集以??等比数列的形式设置可以充分的利用成人数据集
本文编号:2965578
【文章来源】:安徽理工大学安徽省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
图2.1通用的差分隐私保护模型??
。,通常会产生更多噪音。??斯网络??网络是有向无环图,其具有每个节点的概率分布。每个点之间的弧表示概率依懒性。通常在给定分配给其它节可用于计算下一个节点的条件概率,因此,贝叶斯网络以用于衡量属性之间的相关性。当从数据集学习贝叶斯表示数据集的数据属性。??包含d个属性的数据集,分别为4,土...4心因此,定一组d个父子属性(AP)对,即,〇4丨,户1),(^2,户2),...,(4个石是乂中的唯一属性;??个乃是羔的父集合,包括X中的一些属性;??于任何贝叶斯网络中没有从為到4的边缘,斯网络是非循环的。??
SS?(Race,?Country,?Education,?Workclass,Occupation)和弱集合?WS?(Race)。本文为??鲁棒关联属性集ss执行局部差分隐私预算为的隐私保护,为弱关联属性集ws??执行预算为ft的隐私保护,因此构建的h度私有贝叶斯网络BN如图下图5.1所??不。??^^.ace^ ̄ ̄0.014856->^^ucation)--0.336405+<OccupatiOT|??0.139517?^?£:?、#?2??(Country)—0.012541->nVorkclass)--0.017104-^f?Income?)??图5.1基于成人数据集六个属性的h度私有贝叶斯网络BN??Fig.5.1?A?A:-degree?private?Bayesian?network?BN?over?six?attributes?of?the?Adult?data?set?DS??为了分析h度私有贝叶斯网络BN的分类效果,从两个类别上进行评估,分??别是预测个体是否是白人,以及年收入是否超过50K。另一个方面,将数据集分??为六个等级,即Z=(1K,2K,?4K,8K,16K,32K),其中1K=1000。数据集以??等比数列的形式设置可以充分的利用成人数据集
本文编号:2965578
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2965578.html