当前位置:主页 > 科技论文 > 软件论文 >

众包平台下基于差分隐私的激励机制和数据分析方法研究

发布时间:2021-12-09 04:13
  众包的概念被提出以来就日益受到学术界和工业界的广泛关注,随着互联网技术和移动智能设备的蓬勃发展,众包任务的执行也变得更加高效。但是,随着众包模式的广泛应用,隐私问题也随之而来,人们在执行众包任务时不希望透露过多的个人信息。概括来说,众包系统中隐私问题主要存在于以下两方面:一方面,在基于反向拍卖的激励机制中存在着披露众包工作者竞标信息的风险;另一方面,利用众包工作者提供的数据进行预测模型训练的阶段可能会泄露工作者的个人隐私。针对众包场景下的隐私泄露问题,本文的主要贡献如下:针对基于反向拍卖的激励机制中众包工作者竞标信息泄露问题,本文提出了一种基于差分隐私的激励机制,简称DP-mp RA。在工作者上传自己的竞标信息后,平台确定支付的价格集合,对于集合中的每一个价格,在满足数据聚集后误差阈值的限制条件下,选出获胜者集合。应用差分隐私的指数机制,以一定的概率选出最终获胜者集合。最后,根据每个工作者的评级进行差异化付款,进一步减少平台付款总额。经过理论证明,DP-mp RA满足差分隐私保护,同时也满足真实性和个人理性。通过实验仿真表明在保证相同隐私级别的前提下,DP-mp RA机制得到的平台付款... 

【文章来源】:南京邮电大学江苏省

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

众包平台下基于差分隐私的激励机制和数据分析方法研究


基于反向拍卖的众包系统

隐私,差分,机制


南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍12图2.2差分隐私机制图解差分隐私具备几个重要的属性,例如可组合性、鲁棒性等等。可组合性实现了差分隐私机制的模块化设计:如果机制的所有组件都服从差分隐私的,那么它们的组合也服从差分隐私;鲁棒性意味着差分隐私将不会受对手任何可用的辅助信息的影响。这些在本文的场景中非常有用。实现-差分隐私的通用方法有两种,拉普拉斯机制和指数机制。下面我们将重点介绍下这两种机制。2.2.1拉普拉斯机制拉普拉斯机制是实现差分隐私保护的一种方式,这种机制仅适用于查询结果为数值型数据的场景。在介绍拉普拉斯机制之前,先引入一个基本概念:全局敏感度GSx。定义2-8(全局敏感度):对于任意一个查询函数::→z,其中是一个给定的数据集,z为 维实数向量,是查询函数的返回结果,在任意一对相邻数据集和k,全局敏感度定义为: x=∥k∥; (2.5)中∥(k)∥;表示 和(k)之间的曼哈顿(Manhattan)距离。全局敏感度反应了一个查询函数在一对相邻数据集上查询变化的最大范围。一些函数的全局敏感度较小,那只需要加入少量的噪声,就可以掩盖一条记录的删除对查询结果的影响,最终实现差分隐私保护,若函数具有较大的全局敏感度(如平均值),必须在函数输出时添加足够大的噪声才能保证隐私的安全。

分布图,概率密度函数,隐私


南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍13定义2-9(拉普拉斯机制):对于一个查询函数:→z,GSx表示查询函数的全局敏感度,如果随机算法满足:=+,则A满足差分隐私保护,特别说明,的概率密度为:= 2xx2.6即服从均值为0,尺度参数λ为x/的拉普拉斯分布。从公式2.6中可以看到添加的噪声量和全局敏感度GSx成正比,和隐私预算成反比。图2.3给出了拉普拉斯分布图,由下图可以观察到,全局敏感度GSx越大,隐私预算就越小,引入的噪声量就越多,隐私保护的级别越高。图2.3不同ε下的概率密度函数2.2.2指数机制由于拉普拉斯机制仅适用于数值型结果,在一些特定的场景中,往往需要返回离散型结果,例如某一方案或某一选择。为此,McSherry等人提出了指数机制。下面给出以下定义定义2-10(可用性函数):设查询函数的输出对象组成值域Range,域中的每一个值∈是一个实体对象,为给定的数据集,函数q,→称为输出值的可用性函数,用来评估输出值的优劣程度。设;和为任意一对相邻数据集,函数q的敏感度定义为:q=,∥;,,∥2.7

【参考文献】:
期刊论文
[1]面向数据库应用的隐私保护研究综述[J]. 周水庚,李丰,陶宇飞,肖小奎.  计算机学报. 2009(05)



本文编号:3529896

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3529896.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户32f7b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com