MapReduce下差分隐私保护技术研究与实现
发布时间:2021-12-25 02:29
随着云计算与大数据技术的飞速发展,基于Hadoop平台的MapReduce技术得到了广泛应用。通过将数据挖掘算法与MapReduce技术相结合,能够更加便捷高效地获取有价值的信息。分类算法作为数据挖掘中的一类重要算法,对数据的预测分类起到关键作用。随机森林是分类算法中的典型代表,在各个领域都得到了大规模应用,但是子决策树的分类结果以及相应的计数信息都有可能造成隐私数据的泄露。MapReduce环境下满足差分隐私保护随机森林算法的目标是保证差分隐私的前提下提高分类数据的准确性。本文针对目前在MapReduce环境中所面临的数据使用与安全问题,提出了基于分布式环境的差分隐私保护算法。该算法将特征选择方案结合指数机制进行设计,通过采用等差分配方式、等比分配方式以及均分分配方式三种不同的隐私预算分配方式,使算法的分类准确率得到明显提升,显著降低了计算量,提高了运行速度。主要的研究内容如下:(1)针对在分布式环境下海量数据在运算处理的过程中容易遇到数据泄露以及恶意分析的问题,提出了基于MapReduce的分布式计算框架下满足差分隐私的随机森林算法(Differential Privacy Map...
【文章来源】:南京邮电大学江苏省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
MapReduce工作流程
南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍14(a)1()nii-差分隐私(b)imax-差分隐私图2.3差分隐私的组合特性2.3本章小结本章节主要介绍了云平台中的MapReduce并行分布式计算框架和差分隐私保护中的关键技术。首先,对Hadoop云平台的整体架构和MapReduce的工作流程及特性做出了总体阐述。紧接着介绍了在MapReduce环境下的隐私保护技术,并针对在此环境中遇到的隐私安全问题,通过运用差分隐私保护技术对问题进行处理。最后介绍了差分隐私保护技术的相关概念和组合特性。
决策树算法的分类过程
【参考文献】:
期刊论文
[1]重复攻击下差分隐私保护参数ε的选取方法[J]. 郝晨艳,彭长根,张盼盼. 计算机工程. 2018(07)
[2]MapReduce框架下支持差分隐私保护的随机梯度下降算法[J]. 俞艺涵,付钰,吴晓平. 通信学报. 2018(01)
[3]矩阵机制下差分隐私数据发布方法的误差分析[J]. 吴英杰,陈靖麟,蔡剑平,王一蕾. 计算机科学与探索. 2018(07)
[4]不完全数据集的差分隐私保护决策树研究[J]. 沈思倩,毛宇光,江冠儒. 计算机科学. 2017(06)
[5]基于MapReduce的分布式改进随机森林学生就业数据分类模型研究[J]. 乔非,葛彦昊,孔维畅. 系统工程理论与实践. 2017(05)
[6]移动云计算研究进展与趋势[J]. 崔勇,宋健,缪葱葱,唐俊. 计算机学报. 2017(02)
[7]DiffPRFs:一种面向随机森林的差分隐私保护算法[J]. 穆海蓉,丁丽萍,宋宇宁,卢国庆. 通信学报. 2016(09)
[8]MapReduce框架下支持差分隐私保护的k-means聚类方法[J]. 李洪成,吴晓平,陈燕. 通信学报. 2016(02)
[9]基于坐标变换的k匿名位置隐私保护方法[J]. 林少聪,叶阿勇,许力. 小型微型计算机系统. 2016(01)
[10]差分隐私保护参数ε的选取研究[J]. 何贤芒,王晓阳,陈华辉,董一鸿. 通信学报. 2015(12)
本文编号:3551629
【文章来源】:南京邮电大学江苏省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
MapReduce工作流程
南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍14(a)1()nii-差分隐私(b)imax-差分隐私图2.3差分隐私的组合特性2.3本章小结本章节主要介绍了云平台中的MapReduce并行分布式计算框架和差分隐私保护中的关键技术。首先,对Hadoop云平台的整体架构和MapReduce的工作流程及特性做出了总体阐述。紧接着介绍了在MapReduce环境下的隐私保护技术,并针对在此环境中遇到的隐私安全问题,通过运用差分隐私保护技术对问题进行处理。最后介绍了差分隐私保护技术的相关概念和组合特性。
决策树算法的分类过程
【参考文献】:
期刊论文
[1]重复攻击下差分隐私保护参数ε的选取方法[J]. 郝晨艳,彭长根,张盼盼. 计算机工程. 2018(07)
[2]MapReduce框架下支持差分隐私保护的随机梯度下降算法[J]. 俞艺涵,付钰,吴晓平. 通信学报. 2018(01)
[3]矩阵机制下差分隐私数据发布方法的误差分析[J]. 吴英杰,陈靖麟,蔡剑平,王一蕾. 计算机科学与探索. 2018(07)
[4]不完全数据集的差分隐私保护决策树研究[J]. 沈思倩,毛宇光,江冠儒. 计算机科学. 2017(06)
[5]基于MapReduce的分布式改进随机森林学生就业数据分类模型研究[J]. 乔非,葛彦昊,孔维畅. 系统工程理论与实践. 2017(05)
[6]移动云计算研究进展与趋势[J]. 崔勇,宋健,缪葱葱,唐俊. 计算机学报. 2017(02)
[7]DiffPRFs:一种面向随机森林的差分隐私保护算法[J]. 穆海蓉,丁丽萍,宋宇宁,卢国庆. 通信学报. 2016(09)
[8]MapReduce框架下支持差分隐私保护的k-means聚类方法[J]. 李洪成,吴晓平,陈燕. 通信学报. 2016(02)
[9]基于坐标变换的k匿名位置隐私保护方法[J]. 林少聪,叶阿勇,许力. 小型微型计算机系统. 2016(01)
[10]差分隐私保护参数ε的选取研究[J]. 何贤芒,王晓阳,陈华辉,董一鸿. 通信学报. 2015(12)
本文编号:3551629
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3551629.html