差分隐私保护中隐私预算的优化与应用
发布时间:2021-07-04 17:36
数据隐私保护不仅需要保护数据安全性,同时还要尽可能提高数据的可用性。在差分隐私保护中,隐私预算的分配直接影响到数据查询结果中噪音添加的大小,也直接决定了数据的可用性与安全性。在一些应用场景中,随着查询次数的增加,甚至趋于无穷时,引入的噪声量迅速增加,从而使得数据的可用性急剧下降。为了解决实际中有限次隐私预算的分配和优化问题,我们提出了几种利用级数来分配隐私预算的差分隐私保护方案。其中,隐私预算ε是以级数形式表示的,并且第4)次预算分配量4)即为级数表达式的第4)个分量,使得隐私预算的总和不超过ε。通过提出的分配方法,可以有效地降低噪音的增量速度,并对Taylor级数展开法、级数法和特殊级数法三种类型的级数进行了隐私预算分配的评价。这些方法可以形成无限次数据处理的隐私保护方法。此外,对于一些应用场景,数据处理是有限次的,针对这种情况,提出并分析了一些优化的隐私预算分配方法。理论分析和实验结果表明,基于级数的方法满足ε-差分隐私保护需求,而级数法和特殊级数法引入的噪声远小于二分法。因此,提高了数据的可用性。
【文章来源】:南京邮电大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
交互式框架
图 2.2 非交互式框架护方法的性能度量算法的关键在于满足隐私性的前提下尽可能提高数据的可隐私保护机制实现,例如 Laplace 机制通过向真实数据添的保护。数据可用性表示数据分析者在使用差分隐私化后掘以及其他分析操作,并保证分析结果的正确性和准确性虑隐私预算的分配是否合理。通常从以下三方面来衡量差度:差分隐私保护方法的隐私保护强度由隐私预算 决定小,隐私保护性越高。若算法将隐私预算耗尽,则算法将
大学硕士研究生学位论文 第六章 实于预算分配的差分隐私 K-means 算法实验结果数据集表现h先,我们设差分隐私预算 ,聚类个数 。接着,我们在数据集 BK-means 算法,并且迭代过程中不引入噪声,从而得到一个无噪的、精确的聚类然后,我们分别执行 5,10,15,20 和 50 次迭代,迭代过程中隐私预算分配采用三种方法:二分法、特殊级数法和 2 级数法,从而得到若干个含噪聚类结们分别比较迭代次数 m=5,m=10,m=15 以及 m=20 时三种方法的 F-measure 值。实验结果及数据见图 6.4 和表 6.5。
【参考文献】:
期刊论文
[1]基于差分隐私的大数据隐私保护[J]. 朱天清,何木青,邹德清. 信息安全研究. 2015(03)
[2]基于差分隐私保护的DP-DBScan聚类算法研究[J]. 吴伟民,黄焕坤. 计算机工程与科学. 2015(04)
[3]面向频繁模式挖掘的差分隐私保护研究综述[J]. 丁丽萍,卢国庆. 通信学报. 2014(10)
[4]一种面向决策树构建的差分隐私保护算法[J]. 熊平,朱天清,金大卫. 计算机应用研究. 2014(10)
[5]面向数据发布和分析的差分隐私保护[J]. 张啸剑,孟小峰. 计算机学报. 2014(04)
[6]差分隐私保护及其应用[J]. 熊平,朱天清,王晓峰. 计算机学报. 2014(01)
[7]p级数的发散速度或收敛值域[J]. 郝乐,马乾凯. 沈阳大学学报(自然科学版). 2013(06)
[8]差分隐私保护k-means聚类方法研究[J]. 李杨,郝志峰,温雯,谢光强. 计算机科学. 2013(03)
[9]面向数据库应用的隐私保护研究综述[J]. 周水庚,李丰,陶宇飞,肖小奎. 计算机学报. 2009(05)
[10]p-级数的两个求和公式[J]. 刘凤林,杨华. 天津科技大学学报. 2005(04)
本文编号:3265235
【文章来源】:南京邮电大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
交互式框架
图 2.2 非交互式框架护方法的性能度量算法的关键在于满足隐私性的前提下尽可能提高数据的可隐私保护机制实现,例如 Laplace 机制通过向真实数据添的保护。数据可用性表示数据分析者在使用差分隐私化后掘以及其他分析操作,并保证分析结果的正确性和准确性虑隐私预算的分配是否合理。通常从以下三方面来衡量差度:差分隐私保护方法的隐私保护强度由隐私预算 决定小,隐私保护性越高。若算法将隐私预算耗尽,则算法将
大学硕士研究生学位论文 第六章 实于预算分配的差分隐私 K-means 算法实验结果数据集表现h先,我们设差分隐私预算 ,聚类个数 。接着,我们在数据集 BK-means 算法,并且迭代过程中不引入噪声,从而得到一个无噪的、精确的聚类然后,我们分别执行 5,10,15,20 和 50 次迭代,迭代过程中隐私预算分配采用三种方法:二分法、特殊级数法和 2 级数法,从而得到若干个含噪聚类结们分别比较迭代次数 m=5,m=10,m=15 以及 m=20 时三种方法的 F-measure 值。实验结果及数据见图 6.4 和表 6.5。
【参考文献】:
期刊论文
[1]基于差分隐私的大数据隐私保护[J]. 朱天清,何木青,邹德清. 信息安全研究. 2015(03)
[2]基于差分隐私保护的DP-DBScan聚类算法研究[J]. 吴伟民,黄焕坤. 计算机工程与科学. 2015(04)
[3]面向频繁模式挖掘的差分隐私保护研究综述[J]. 丁丽萍,卢国庆. 通信学报. 2014(10)
[4]一种面向决策树构建的差分隐私保护算法[J]. 熊平,朱天清,金大卫. 计算机应用研究. 2014(10)
[5]面向数据发布和分析的差分隐私保护[J]. 张啸剑,孟小峰. 计算机学报. 2014(04)
[6]差分隐私保护及其应用[J]. 熊平,朱天清,王晓峰. 计算机学报. 2014(01)
[7]p级数的发散速度或收敛值域[J]. 郝乐,马乾凯. 沈阳大学学报(自然科学版). 2013(06)
[8]差分隐私保护k-means聚类方法研究[J]. 李杨,郝志峰,温雯,谢光强. 计算机科学. 2013(03)
[9]面向数据库应用的隐私保护研究综述[J]. 周水庚,李丰,陶宇飞,肖小奎. 计算机学报. 2009(05)
[10]p-级数的两个求和公式[J]. 刘凤林,杨华. 天津科技大学学报. 2005(04)
本文编号:3265235
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3265235.html