基于概率图模型的高维数据差分隐私发布
发布时间:2021-06-29 02:08
随着信息技术的高速发展,大量用户数据生成并被积累,成为备受瞩目的资源,如今许多热门应用都是基于用户数据的个性化、智能化服务,因此针对高维数据使用中的隐私保护成为研究热点。差分隐私凭借其可以抵御背景无关知识攻击和可量化隐私保护水平的优点在业界得到广泛认可,成为隐私保护的一个实际标准。我们也看到,虽然差分隐私可以有效地处理简单的关系数据,但是针对复杂高维数据的差分隐私发布还存在诸多挑战。目前研究重点是在保护差分隐私的前提下,通过降低数据维数,简化属性之间的关系,使得发布数据具有可接受的准确性和可用性。本文研究高维数据差分隐私发布中的问题,将具体应用中的问题抽象为计算概率模型中变量的概率分布,提出基于概率图模型的高维数据差分隐私发布方法。针对高维数据差分隐私发布中数据空间比较稀疏、计算复杂度高,以及属性之间关系复杂和无法定向的问题,提出基于马尔可夫网的高维数据差分隐私发布的方法。具体利用概率图模型中的马尔可夫模型表示属性之间的依赖关系,然后结合图形近似推理算法计算差分隐私保护下的高维数据集的分布情况。由于实际生活中变量之间的关系存在无向和有向两种关系,使用马尔可夫网模型仅仅解决了无向关系问题...
【文章来源】:南京邮电大学江苏省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
差分隐私保护算法的组合性质
(b) 非交互式数据发布图 2.2 差分隐私保护数据发布两种方式发布[28]中,数据管理者根据用户提出查询请求,将扰动之后式通过隐藏数据集全貌从而保护个体隐私。据发布[28]中,数据管理者在满足差分隐私的条件下一次性发布对原始数据集进行扰动之后的不精确的数据集。非交互式数据发布方式,所用到的数据集是列联表的形式。照变量进行分类时所列出的频数表,它是非交互式数据发布D 包含 个记录,由 个布尔变量组成,列联表就是对数据集数所形成的表格。事实上,对数据处理的内容并不是列联表值进行统计所得的计数,也称为边缘频数。列联表数据发布的应用中主要分为两种方法。第一种是先加单元格中加入噪声,然后计算变量扰动后列联表的边缘频数
学硕士研究生学位论文 第三章 基于概率图模型的高维数据差分隐私发章 基于概率图模型的高维数据差分隐私发布算法隐私保护模型[9]的思想主要是:当一个数据集 D 中包含 A、B、C 等多个用任意查询操作 ,例如计数、求和、平均值、中位数或者其他范围查询等 ),如果将用户 A 的信息从 D 中删除后进行查询得到的结果仍然为 ( )息并没有因为包含在数据集 D 中而产生了额外的风险。图 3.1 展示了差分
本文编号:3255502
【文章来源】:南京邮电大学江苏省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
差分隐私保护算法的组合性质
(b) 非交互式数据发布图 2.2 差分隐私保护数据发布两种方式发布[28]中,数据管理者根据用户提出查询请求,将扰动之后式通过隐藏数据集全貌从而保护个体隐私。据发布[28]中,数据管理者在满足差分隐私的条件下一次性发布对原始数据集进行扰动之后的不精确的数据集。非交互式数据发布方式,所用到的数据集是列联表的形式。照变量进行分类时所列出的频数表,它是非交互式数据发布D 包含 个记录,由 个布尔变量组成,列联表就是对数据集数所形成的表格。事实上,对数据处理的内容并不是列联表值进行统计所得的计数,也称为边缘频数。列联表数据发布的应用中主要分为两种方法。第一种是先加单元格中加入噪声,然后计算变量扰动后列联表的边缘频数
学硕士研究生学位论文 第三章 基于概率图模型的高维数据差分隐私发章 基于概率图模型的高维数据差分隐私发布算法隐私保护模型[9]的思想主要是:当一个数据集 D 中包含 A、B、C 等多个用任意查询操作 ,例如计数、求和、平均值、中位数或者其他范围查询等 ),如果将用户 A 的信息从 D 中删除后进行查询得到的结果仍然为 ( )息并没有因为包含在数据集 D 中而产生了额外的风险。图 3.1 展示了差分
本文编号:3255502
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3255502.html