数据发布中的敏感属性隐私保护方法研究
发布时间:2017-12-26 14:19
本文关键词:数据发布中的敏感属性隐私保护方法研究 出处:《贵州大学》2016年硕士论文 论文类型:学位论文
更多相关文章: 单敏感属性 多敏感属性 隐私保护 语义分析 相关性
【摘要】:如今大数据产业的发展对全球经济发展方式的转变、人类生活水平的提高和国家综合能力的增强起到显著推动作用。为促进该产业又好又快的发展,首要任务就是开放共享数据,但企业或组织机构发布的数据中可能存在工作秘密和个人隐私等敏感信息,故发布之前要对这些数据进行处理,如何保证所发布的数据既有较高的可用性又能保证这些敏感信息不被泄露就变得至关重要。本文首先阐述了数据发布中隐私保护的研究背景和研究现状,详细介绍了攻击者获取用户信息的攻击形式和匿名模型的实现技术;其次,在单敏感属性隐私保护方面,深入研究了K-Anonymity和L-Diversity模型,并针对两种模型均无法抵御背景知识攻击和相似性攻击,提出面向分类型敏感属性difsimt),,(分级匿名算法,该算法对敏感属性的现实意义进行语义分析,将敏感属性相互之间的相似程度进行量化,根据量化值来实现对敏感属性值的划分,最终使等价类中属性值存在语义相似性增大的同时存在语义差异性;再次,在多敏感属性隐私保护方面,本文对多维桶分组技术(MSB)及其提出的三种算法进行深入研究,针对MSB技术在敏感属性增多时会出现匿名数据信息损失率较大、数据隐匿率较高等情况,提出了一种改进的MBF高效算法,即最大选择度桶优先算法(Maximum Selectivity Bucket First),该方法将原始数据表分为一个准标识符表和若干以敏感属性相关性划分而成的敏感属性子表,多个子表之间使用组内ID进行连接,这样降低了敏感属性的维数,该算法可以显著降低匿名率,能更好保护用户的敏感信息;最后,通过实验验证这两种算法的有效性,相对于传统经典算法,这两种算法均以牺牲少量的时间消耗为代价来更高层次地保护用户的敏感属性信息。
【学位授予单位】:贵州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP309
,
本文编号:1337595
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1337595.html