基于抽样路径的K-匿名隐私保护算法
发布时间:2017-07-26 15:25
本文关键词:基于抽样路径的K-匿名隐私保护算法
【摘要】:K-匿名是信息隐私保护的一种常用技术,而使用K-匿名技术不可避免会造成发布数据的信息损失,因此,如何提高K-匿名化后数据集的可用性一直以来都是K-匿名隐私保护的研究重点。对此提出了一种基于抽样路径的局域泛化算法——SPOLG算法。该算法基于泛化格寻找信息损失较小的泛化路径,为减少寻径时间,引入等概率抽样的思想,选用等概率抽样中的系统抽样方法进行取样,利用样本代替数据集在泛化格上寻找目标泛化路径,最后在该路径上对数据集进行泛化。同时,本算法使用局域泛化技术,能够降低信息损失量,提高发布数据集的可用性。实验结果证明,本算法匿名化的数据集信息损失度低,数据可用性高。
【作者单位】: 徐州医科大学医学信息学院;
【关键词】: 隐私保护 路径 信息损失 抽样 K-匿名
【基金】:江苏省产学研联合创新项目(BY2014033) 徐州市科技计划项目(XM13B021) 国家安全生产重大事故防治关键技术科技项目(Jiangsu-0006-2016AQ)
【分类号】:TP309
【正文快照】: 0 引言 K-匿名[1]是一种简单而有效的隐私保护模型,实施K-匿名要考虑两个方面:(1)确保数据发布过程中隐私不泄露;(2)发布的匿名数据具有实用性。 基于以上两个要求,众多学者提出了许多匿名算法。但大体上可以分为全域泛化算法[2]和局域泛化算法[3]。相比之下,局域泛化算法不,
本文编号:577008
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/577008.html