当前位置:主页 > 科技论文 > 软件论文 >

基于敏感控制的差分隐私数据发布方法研究

发布时间:2017-09-19 00:42

  本文关键词:基于敏感控制的差分隐私数据发布方法研究


  更多相关文章: 表数据 数据发布 隐私保护 差分隐私 κ-匿名


【摘要】:随着云计算、无线网络和电子商务等基于互联网的应用迅速发展,在网络中留下大量的数据。然而,这些数据的收集者可能分别属于不同机构,数据的集成综合分析需要将这些数据公开发布或与分析者共享。但这些数据往往包含了个人或企业机构的敏感信息,需要有效的隐私保护方法对数据进行隐私保护处理。因此,数据发布或共享的隐私保护研究在近10多年来成为了一个受到广泛关注的热点研究方向。本文主要围绕当前具有复杂关联性的数据发布的隐私保护问题开展研究,通过对数据发布隐私保护方法的研究现状进行了综述和分析,指出了现有的差分隐私模型和方法用于复杂关联性数据时易受推断攻击而导致隐私泄漏;提出了基于敏感控制的差分隐私模型以及相关处理算法来解决据关联性带来的隐私泄露问题,并将该模型与k-匿名模型结合提高数据的效用性。论文的主要研究工作如下:(1)提出基于敏感控制的差分隐私模型和结合k-匿名的敏感控制差分隐私模型用以解决发布具有复杂关联性数据时因推断攻击而泄露隐私的问题和因添加过量噪声而破坏匿名数据效用性的问题。基于敏感控制的差分隐私模型利用敏感控制参数对敏感模板中隐含的敏感规则的最大置信度进行限制,而在结合k-匿名的敏感控制差分隐私模型中参数k作为粒度控制参数来限制模板所代表数据记录的最小数量。(2)采用贪心划分和模板精确化方法对文中提出的基于敏感控制的差分隐私数据发布模型和结合k-匿名的差分隐私数据发布模型实现了有效的近似算法。由于两种模型均属于NP难问题,因此在进行隐私保护过程中利用贪心策略能有效减少算法的搜索空间,而在对数据进行贪心划分后,模板精确化能有效提高数据的效用性。并通过对安全性和时间复杂度进行讨论说明了实现的算法能满足隐私需求并且有较好的扩展性。(3)利用实现的两个近似算法,搭建了对应的隐私保护数据发布系统,并利用真实数据集Adult在该系统上进行实验。通过对比在不同大小的匿名数据集学习到的决策树的分类错误率和其隐私保护消耗的时间,说明本文提出的两种模型能安全有效的进行数据发布。同时,随着实验数据规模的增大而进行隐私保护所需的时间变化不大可以说明两种算法对大规模数据依然有效。并且,当选择了合适的粒度参数能有效提高匿名数据的效用性。
【关键词】:表数据 数据发布 隐私保护 差分隐私 κ-匿名
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP309
【目录】:
  • 摘要3-5
  • ABSTRACT5-9
  • 第1章 绪论9-17
  • 1.1 研究背景及意义9-11
  • 1.2 研究现状及分析11-15
  • 1.3 本文的主要创新与结构安排15-17
  • 第2章 数据发布稳私保护方法与问题分析17-27
  • 2.1 隐私和隐私泄露与保护17-18
  • 2.1.1 隐私和隐私泄露17
  • 2.1.2 隐私保护17-18
  • 2.2 数据发布隐私保护策略18-20
  • 2.3 经典的数据发布隐私保护模型及问题分析20-26
  • 2.3.1 K-匿名模型20-21
  • 2.3.2 差分隐私模型21-25
  • 2.3.3 差分隐私模型的问题分析25-26
  • 2.4 本章小结26-27
  • 第3章 基于敏感控制的差分隐私保护方法27-43
  • 3.1 复杂关联性数据发布的隐私问题27-32
  • 3.2 基于敏感控制的差分隐私数据发布问题描述32
  • 3.3 基于敏感控制的差分隐私保护模型32-35
  • 3.4 基于敏感度控制的差分隐私保护算法35-38
  • 3.5 结合k-匿名的敏感控制差分隐私保护模型和算法38-41
  • 3.6 算法隐私性与复杂性分析41
  • 3.7 本章小结41-43
  • 第4章 系统设计与实验分析43-53
  • 4.1 系统体系结构43-44
  • 4.2 系统用例图和类图44-46
  • 4.3 实验环境与数据集46-47
  • 4.4 匿名数据信息量的度量方法47-48
  • 4.5 基于敏感控制的差分隐私保护算法的数据效用性分析48-49
  • 4.6 结合k-匿名的敏感控制差分隐私保护算法实验分析49-52
  • 4.6.1 粒度控制参数对数据效用性的影响分析49-50
  • 4.6.2 数据规模对算法运行时间和数据效用性的影响分析50-52
  • 4.7 本章小结52-53
  • 第5章 总结与展望53-55
  • 5.1 总结53
  • 5.2 展望53-55
  • 参考文献55-59
  • 附录一 拉普拉斯机制产生噪声59
  • 附录二 指数机制选取分裂点59-61
  • 攻读硕士学位期间的研究成果61-62
  • 致谢62-63


本文编号:878518

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/878518.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户09426***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com