基于云计算的隐私保护数据发布算法研究
发布时间:2021-04-13 12:31
大数据云计算在推动各行各业快速发展的同时,也给个人隐私安全带来了严峻挑战。为了能够更好地推动各行业的快速发展,越来越多数据需要被共享,这些数据中包含了一些较为敏感的隐私信息,若对这些信息不加以任何保护就直接发布将会导致隐私信息的泄露,威胁数据拥有者的生命财产安全,甚至威胁国家的信息安全,因此对数据发布隐私保护技术的研究变得非常重要。目前,针对数据发布的隐私保护方法主要有基于扰乱、基于加密和基于匿名三种形式。本论文通过对现有的基于匿名技术的隐私保护模型进行分析,根据敏感属性个数的多少,提出了针对单敏感属性的匿名隐私保护模型--(αi,k,β)-匿名保护模型和针对多敏感属性的匿名隐私保护模型--Multi-(αi,k,β)-匿名保护模型。本文的主要研究内容如下:1.对目前数据发布隐私保护的三种主流模型进行分析和对比,综合考虑这三种主流模型的优缺点,选择了兼顾实用性与安全性的匿名保护模型作为研究重点,并详细介绍了该模型的研究现状和相关基本知识。2.针对单敏感属性的匿名保护模型进行了研究。(αi,k)-匿名模型的优点是能抵御同质攻击,但是它存在语义相似性攻击的风险。为抵御这种风险,提出了一种可...
【文章来源】:青岛理工大学山东省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
k 值不同时运行时间图
青岛理工大学工学硕士学位论文36图3.3QI取不同值时运行时间图3.5.3信息泛化损失程度分析信息的泛化损失程度是衡量一个保护算法好坏的重要指标。在本章中提到了泛化损失的计算方式。信息的泛化损失程度=总共泛化损失/元组总数。图3.4是三种算法在k取不同值时的泛化损失程度对比图。由图3.4可以看出,随着k值的增大,信息的泛化损失率一直在提高,这是因为随着k值的增大,需要泛化的元组数增多,准标识符属性的数量增多,泛化的范围也相应增大,泛化损失就会越大。(p,k,d)算法模型的泛化损失要高于另外两个算法模型,这是因为KACM算法和(αi,k,β)算法充分考虑了准标识符属性和敏感属性的联系,在选择等价类中元组时总优先选择泛化程度最小的元组。图3.4泛化损失程度图
青岛理工大学工学硕士学位论文36图3.3QI取不同值时运行时间图3.5.3信息泛化损失程度分析信息的泛化损失程度是衡量一个保护算法好坏的重要指标。在本章中提到了泛化损失的计算方式。信息的泛化损失程度=总共泛化损失/元组总数。图3.4是三种算法在k取不同值时的泛化损失程度对比图。由图3.4可以看出,随着k值的增大,信息的泛化损失率一直在提高,这是因为随着k值的增大,需要泛化的元组数增多,准标识符属性的数量增多,泛化的范围也相应增大,泛化损失就会越大。(p,k,d)算法模型的泛化损失要高于另外两个算法模型,这是因为KACM算法和(αi,k,β)算法充分考虑了准标识符属性和敏感属性的联系,在选择等价类中元组时总优先选择泛化程度最小的元组。图3.4泛化损失程度图
【参考文献】:
期刊论文
[1]用于敏感属性保护的(θ,k)-匿名模型[J]. 程楠楠,刘树波,熊星星,蔡朝晖,张家浩. 郑州大学学报(理学版). 2019(03)
[2]面向医疗数据发布的动态更新隐私保护算法[J]. 陈虹云,王杰华,胡兆鹏,贾露,喻纪文. 计算机科学. 2019(01)
[3]个性化(α,l)-多样性k-匿名隐私保护模型[J]. 曹敏姿,张琳琳,毕雪华,赵楷. 计算机科学. 2018(11)
[4]模糊t-closeness隐私保护方法研究[J]. 陈晓宇,韩斌,黄树成,朱文正. 计算机应用与软件. 2018(09)
[5](p,k)匿名数据集的增量更新算法[J]. 贾俊杰,闫国蕾,邢里程,陈菲. 计算机工程与科学. 2018(07)
[6]移动医疗中个性化l-多样性匿名隐私保护模型[J]. 李文,黄丽韶,罗恩韬. 计算机科学与探索. 2018(05)
[7]基于聚类的S-KACA匿名隐私保护算法[J]. 毛庆阳,胡燕. 武汉大学学报(工学版). 2018(03)
[8]基于多敏感属性分级的(αij,k,m)-匿名隐私保护方法[J]. 王秋月,葛丽娜,耿博,王利娟. 计算机应用. 2018(01)
[9]同态加密技术及其在云计算隐私保护中的应用[J]. 李宗育,桂小林,顾迎捷,李雪松,戴慧珺,张学军. 软件学报. 2018(07)
[10]面向多敏感属性的匿名隐私保护方法[J]. 张荣庆,徐光侠. 重庆邮电大学学报(自然科学版). 2017(04)
博士论文
[1]大数据发布隐私保护技术研究[D]. 晏燕.兰州理工大学 2018
[2]大数据时代个人信息保护研究[D]. 李媛.西南政法大学 2016
硕士论文
[1]基于敏感度分级的k-匿名技术研究与实现[D]. 孙进考.北京邮电大学 2019
[2]基于k-匿名的相同敏感值数据表隐私保护研究[D]. 吕含笑.湖北民族学院 2018
本文编号:3135302
【文章来源】:青岛理工大学山东省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
k 值不同时运行时间图
青岛理工大学工学硕士学位论文36图3.3QI取不同值时运行时间图3.5.3信息泛化损失程度分析信息的泛化损失程度是衡量一个保护算法好坏的重要指标。在本章中提到了泛化损失的计算方式。信息的泛化损失程度=总共泛化损失/元组总数。图3.4是三种算法在k取不同值时的泛化损失程度对比图。由图3.4可以看出,随着k值的增大,信息的泛化损失率一直在提高,这是因为随着k值的增大,需要泛化的元组数增多,准标识符属性的数量增多,泛化的范围也相应增大,泛化损失就会越大。(p,k,d)算法模型的泛化损失要高于另外两个算法模型,这是因为KACM算法和(αi,k,β)算法充分考虑了准标识符属性和敏感属性的联系,在选择等价类中元组时总优先选择泛化程度最小的元组。图3.4泛化损失程度图
青岛理工大学工学硕士学位论文36图3.3QI取不同值时运行时间图3.5.3信息泛化损失程度分析信息的泛化损失程度是衡量一个保护算法好坏的重要指标。在本章中提到了泛化损失的计算方式。信息的泛化损失程度=总共泛化损失/元组总数。图3.4是三种算法在k取不同值时的泛化损失程度对比图。由图3.4可以看出,随着k值的增大,信息的泛化损失率一直在提高,这是因为随着k值的增大,需要泛化的元组数增多,准标识符属性的数量增多,泛化的范围也相应增大,泛化损失就会越大。(p,k,d)算法模型的泛化损失要高于另外两个算法模型,这是因为KACM算法和(αi,k,β)算法充分考虑了准标识符属性和敏感属性的联系,在选择等价类中元组时总优先选择泛化程度最小的元组。图3.4泛化损失程度图
【参考文献】:
期刊论文
[1]用于敏感属性保护的(θ,k)-匿名模型[J]. 程楠楠,刘树波,熊星星,蔡朝晖,张家浩. 郑州大学学报(理学版). 2019(03)
[2]面向医疗数据发布的动态更新隐私保护算法[J]. 陈虹云,王杰华,胡兆鹏,贾露,喻纪文. 计算机科学. 2019(01)
[3]个性化(α,l)-多样性k-匿名隐私保护模型[J]. 曹敏姿,张琳琳,毕雪华,赵楷. 计算机科学. 2018(11)
[4]模糊t-closeness隐私保护方法研究[J]. 陈晓宇,韩斌,黄树成,朱文正. 计算机应用与软件. 2018(09)
[5](p,k)匿名数据集的增量更新算法[J]. 贾俊杰,闫国蕾,邢里程,陈菲. 计算机工程与科学. 2018(07)
[6]移动医疗中个性化l-多样性匿名隐私保护模型[J]. 李文,黄丽韶,罗恩韬. 计算机科学与探索. 2018(05)
[7]基于聚类的S-KACA匿名隐私保护算法[J]. 毛庆阳,胡燕. 武汉大学学报(工学版). 2018(03)
[8]基于多敏感属性分级的(αij,k,m)-匿名隐私保护方法[J]. 王秋月,葛丽娜,耿博,王利娟. 计算机应用. 2018(01)
[9]同态加密技术及其在云计算隐私保护中的应用[J]. 李宗育,桂小林,顾迎捷,李雪松,戴慧珺,张学军. 软件学报. 2018(07)
[10]面向多敏感属性的匿名隐私保护方法[J]. 张荣庆,徐光侠. 重庆邮电大学学报(自然科学版). 2017(04)
博士论文
[1]大数据发布隐私保护技术研究[D]. 晏燕.兰州理工大学 2018
[2]大数据时代个人信息保护研究[D]. 李媛.西南政法大学 2016
硕士论文
[1]基于敏感度分级的k-匿名技术研究与实现[D]. 孙进考.北京邮电大学 2019
[2]基于k-匿名的相同敏感值数据表隐私保护研究[D]. 吕含笑.湖北民族学院 2018
本文编号:3135302
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3135302.html