当前位置:主页 > 科技论文 > 软件论文 >

一种基于差分隐私的随机森林分类算法研究

发布时间:2024-03-19 06:10
  近年来,随着信息化时代的发展,数据量急剧膨胀,推动了以数据为驱动商业模式的发展进程。数据的价值日益凸显,由此而引发的隐私泄露问题也逐渐增多,数据的隐私问题开始得到大家的重视,所以隐私保护方法的研究成为了学术界关注的热点。事实上,差分隐私就是一种有效的隐私保护方法,它通过对数据添加噪声,随机扰动数据来保护原数据的隐私。同时它通过定量化的方法?来衡量隐私披露的风险,在实际应用过程中,可以根据需求动态调节安全性能。本文在已有关于差分隐私与决策树、随机森林分类算法研究的基础上,针对引入噪声量过大和数据计算开销过高的问题进行了改进。针对引入噪声量过大的问题,本文从两个角度进行分析:一、通过改变树结构的生成方式,以多层子树替代树节点的生成方式来优化隐私预算?;二、通过考虑多层子树替代结构的几何特征,动态调节上下层之间的隐私预算关系。针对数据计算开销过高的问题,本文在多层子树替代算法中,用M-H采样方式来降低运算规模。本文具体工作如下:一、以多层子树替代树节点,设计多层子树替代结构的评估函数。二、用M-H采样搜索方式降低多层决策子树的运算规模。三、根据多层子树替代结构的几何特点,提出MLSR-GPB...

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

图2.1差分隐私定义图

图2.1差分隐私定义图

图2.1差分隐私定义图定义:存在数据集D和1D,定义D与1D是兄弟数据集,即两个数据多只相差一条数据,数学形式1DD1。现在给定一个隐私算法ange(M)表示M的值域,如果算法M在兄弟数据集D和1D上任意的输(CRange(....


图2.2拉普拉斯概率密度函数定义:给定一个实用性评估函数q和数据集D,如果对于算法M按照

图2.2拉普拉斯概率密度函数定义:给定一个实用性评估函数q和数据集D,如果对于算法M按照

1()(),,kADqDYY(2-4)其中,iY是拉普拉斯分布()qlap的随机变量。假设存在一个拉普拉斯噪声函数()exp()xlapbb,其中b的值等于q。即当隐私预算一定时,函数敏感度q越大,....


图2.3差分隐私组合性质图

图2.3差分隐私组合性质图

2.3.4差分隐私的性质在遇到复杂的隐私安全问题时,我们可能需要多次引入差分隐私的方法。不过值得注意的是,不论引入差分隐私多少次,我们都要严格遵循规则,将其分配的隐私预算控制在内,故我们需要介绍差分机制的两个重要性质。性质1:(序列组合性)假设存在不同的算法12,,....


图3.2安全模型分析图

图3.2安全模型分析图

3.1.2模型安全分析基于数据集的攻击:在图3.1所示的模型中,我们给它划定一个安全边界,在安全边界以内,数据的隐私不会泄露。因为构建算法B通过交互式的结构,不断向数据提供方D发送查询请求,而数据方D则将查询后的结果加噪,使得加噪后的数据难以推测出原数据。通过这种方式,可....



本文编号:3932448

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3932448.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f4a00***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com