当前位置:主页 > 科技论文 > 软件论文 >

局部差分隐私约束的扰动数据发布

发布时间:2024-12-22 01:31
  随着互联网技术的发展,便捷的网上购物和个性化的新闻推荐逐渐成为人们日常生活中不可或缺的一部分。在享受这些服务的同时,大量用户的信息数据被不断收集、使用和发布。一方面企业和机构通过这些数据可以更加全面的了解用户,另一方面这些发布的数据可能会泄漏用户的隐私信息,因此在数据发布前需要对其进行匿名化处理,避免用户的敏感信息被泄露。后随机响应是隐私保护数据发布的有效方法之一,这方面的研究工作主要考虑如何设计扰动矩阵,且假设数据集属性变量之间的关系是独立或者完全相关。由于假设数据集属性完全独立会导致它们之间的关系由于扰动而破坏,从而使数据效用下降;假设属性完全相关会导致数据列联表稀疏,计算复杂度过大。为解决该问题,本文提出局部差分隐私约束的扰动数据发布算法,主要研究敏感属性与部分准标识符属性存在依赖关系时,如何有效减小重构攻击导致的隐私泄漏风险。首先,本文按照准标识符属性与敏感属性之间的依赖度对准标识符属性进行划分,用互信息理论寻找原始数据集中对敏感属性具有强依赖关系的准标识符属性,为精确扰动数据属性提供理论依据;其次,针对关联属性和非关联属性,应用不变后随机响应方法分别对某个数据属性或者属性之间的...

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

图2.1收集数据并进行隐私化处理发布流程??Fig2.1?Collects?data?and?performs?privacy?processing?release?process??

图2.1收集数据并进行隐私化处理发布流程??Fig2.1?Collects?data?and?performs?privacy?processing?release?process??

图2.1收集数据并进行隐私化处理发布流程??Fig2.1?Collects?data?and?performs?privacy?processing?release?process??隐私保护数据发布总体过程如图2.1所示,数据发布旨在向公众分享数据或一??些通过数据查询结果,假....


图3.1随机算法K在邻近数据集输出概率??Fig3.1?Probability?of?random?algorithm?K?in?adjacent?data?sets??

图3.1随机算法K在邻近数据集输出概率??Fig3.1?Probability?of?random?algorithm?K?in?adjacent?data?sets??

Pr[K(D,)?e?S]?<?exp(^)?x?Pr[K(D2)?e?S]?(3-1)??则称算法K满足e-差分隐私保护要求,其中e称为隐私保护预算。如图3.1所??示,通过对输出结果的随机化来提供差分隐私保护。??“概率??K(Di)?K(D2)?输出值??图3.1随机算法K....


图3.2?Laplace概率密度函数??Fig3.2?Laplace?probability?density?function??

图3.2?Laplace概率密度函数??Fig3.2?Laplace?probability?density?function??

Pr[K(D,)?e?S]?<?exp(^)?x?Pr[K(D2)?e?S]?(3-1)??则称算法K满足e-差分隐私保护要求,其中e称为隐私保护预算。如图3.1所??示,通过对输出结果的随机化来提供差分隐私保护。??“概率??K(Di)?K(D2)?输出值??图3.1随机算法K....


图4.1随机响应总体框架??Fig4.1?Random?response?overall?framework??

图4.1随机响应总体框架??Fig4.1?Random?response?overall?framework??

通过产生具有己知误分类概率的错误分类变量来保护回答者的隐私信息,其中错??误分类概率是己知的,正是这种错误分类保护了个人的隐私。随机响应的总体方案??由图4.1给出。??被调査者?调査者??数据采集?的真实答案?随机响应观察到的答案??用户?扰动后数据??图4.1随机响应总体框架....



本文编号:4019228

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4019228.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ac1ed***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com