当前位置:主页 > 管理论文 > 移动网络论文 >

基于熵分类的个性化隐私匿名方法

发布时间:2020-06-23 16:46
【摘要】:针对传统(α,k)-匿名模型不能满足敏感属性值之间不同隐私保护程度个性化需求的问题,引入敏感属性值个性隐私敏感因子和个性隐私保护需求度的概念,进而形式化地定义了个性化(α,k)-匿名模型;同时,还提出了一种基于熵分类的个性化隐私匿名方法来实现个性化(α,k)-匿名模型。实验表明:该方法不仅能获得与现有(α,k)-匿名算法近似的信息损失度和时间代价,同时也满足了个性化服务的需求,获得更合理的隐私保护。
【图文】:

信息损失,数据集


度也同样需要加强,从而引起数据集的信息损失度增大。图2是k为6,数据集记录数|T|=45222时,3种算法随准标识符个数|QI|变化时的信息损失度比较,由图2可知:3种算法的信息损失度都会随着准标识符数|QI|的增多而增加,因为当准标识符数|QI|增多时,表明每个元组的需要泛化的属性个数增加了,显然会引起信息损失度增大。图3给出了准标识符个数|QI|=8,k为6时,各算法信息损失度随数据集记录数|T|变化的比较,从图图1|k|值变化下各算法的信息损失度比较Fig.1Informationlosscomparisonofeachalgorithmwhenkvaries图2不同|QI|值下各算法的信息损失度比较ig.2Informationlosscomparisonofeachalgorithmwithdifferent|QI|3中可以看出,各算法在准标识符数|QI|和k值不变的情况下,信息损失度都会随着数据集记录数|T|的增大而增加,因为当数据集记录数|T|增多时,需要泛化的元组数也要增多,从而引起数·183·

信息损失,数据集


方法基础上,用信息损失度RTIL=TIL/|T|×100%来进行分析比较。图1给出了当准标识符个数|QI|为8,数据集记录数|T|=45222时,各算法在k值变化时信息损失度的比较,其中(α,k)-匿名模型中的α值取0.4,以下的实验都为该值。由图1可知:3种算法的信息损失度都会随着k值的增加而增加,因为当k值增大时,表明等价类中的记录数也要求增多,使得对准标识符泛化的程度也同样需要加强,从而引起数据集的信息损失度增大。图2是k为6,数据集记录数|T|=45222时,3种算法随准标识符个数|QI|变化时的信息损失度比较,由图2可知:3种算法的信息损失度都会随着准标识符数|QI|的增多而增加,因为当准标识符数|QI|增多时,表明每个元组的需要泛化的属性个数增加了,显然会引起信息损失度增大。图3给出了准标识符个数|QI|=8,k为6时,各算法信息损失度随数据集记录数|T|变化的比较,从图图1|k|值变化下各算法的信息损失度比较Fig.1Informationlosscomparisonofeachalgorithmwhenkvaries图2不同|QI|值下各算法的信息损失度比较ig.2Informationlosscomparisonofeachalgorithmwithdifferent|QI|3中可以看出,各算法在准标识符数|QI|和k值不变的情况下,信息损失度都会随着数据集记录数|T|的增大而增加,因为当数据集记录数|T|增多时,需要泛化的元组数也要增多,从而

【参考文献】

相关期刊论文 前1条

1 韩建民;于娟;虞慧群;贾l

本文编号:2727624


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2727624.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2cd4f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com