基于敏感信息邻近抵抗的匿名方法研究
发布时间:2023-04-23 13:27
数据匿名化因其安全性和有效性所特有的优势,常被用于解决数据发布的隐私泄露问题。针对相似性攻击造成隐私泄露的问题,本文提出(r,k)–匿名模型,基于敏感属性邻近关联,设定邻近抵抗阈值,并设计满足(r,k)–匿名模型的匿名算法GDPPR(Generalized data for privacy proximity resistance)。采用基于(r,k)–匿名模型改进的模糊聚类技术完成簇的划分,得出隶属矩阵,使得每个等价类中具备邻近关联的敏感属性取值频率不高于阈值。保证匿名化后数据可以满足用户的隐私保护需求,并且具备较高的使用价值。本文主要基于以下两个关键点进行研究:1.研究敏感属性邻近抵抗的匿名模型并设计满足(r,k)–匿名模型GDPPR匿名算法。针对相似性攻击会造成隐私泄露的问题,本文提出了(r,k)–匿名模型。要求匿名后的数据表在满足k-匿名模型的基础上,在同一等价类当中具备邻近关联的敏感属性取值频率不超过阈值r。有效的降低了攻击者通过相似性攻击获取目标敏感信息概率,并通过实验验证(r,k)–匿名模型的匿名效果。2.研究GDPPR算法中数据的可用性。GDPPR算法通过模糊聚类技术完...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究目标及研究内容
1.4 本文组织结构
1.5 本章小结
第2章 相关技术分析
2.1 隐私保护概述
2.2 隐私保护策略
2.3 数据匿名
2.3.1 数据角色划分
2.3.2 属性划分
2.3.3 k-匿名模型
2.3.4 匿名模型实现
2.3.5 等价类
2.4 常见攻击与匿名模型
2.4.1 攻击模式
2.4.2 匿名模型
2.5 匿名评估机制
2.5.1 信息损失
2.5.2 隐私泄露评估
2.6 本章小结
第3章 基于敏感信息邻近抵抗的匿名方法
3.1 (r,k)-匿名模型
3.2 模糊聚类
3.3 距离度量及匿名评估
3.3.1 距离度量
3.3.2 匿名评估度量
3.4 GDPPR算法
3.4.1 算法思想
3.4.2 算法描述
3.4.3 算法实现
3.5 算法分析
3.5.1 正确性分析
3.5.2 数据可用性分析
3.5.3 隐私泄露风险分析
3.5.4 时间复杂度分析
3.6 本章小结
第4章 实验与结果分析
4.1 实验环境
4.2 实验数据集
4.2.1 数据集选取
4.2.2 数据预处理
4.3 Adult数据集
4.3.1 Adult数据集实验结果
4.3.2 Adult数据集可用性分析
4.3.3 Adult数据集泄露风险分析
4.3.4 Adult数据集时间复杂度分析
4.4 Census-Income数据集
4.4.1 Census-Income数据集实验结果
4.4.2 Census-Income数据集可用性分析
4.4.3 Census-Income数据集泄露风险分析
4.4.4 Census-Income数据集时间复杂度分析
4.5 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读学位期间研究成果
致谢
本文编号:3799812
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究目标及研究内容
1.4 本文组织结构
1.5 本章小结
第2章 相关技术分析
2.1 隐私保护概述
2.2 隐私保护策略
2.3 数据匿名
2.3.1 数据角色划分
2.3.2 属性划分
2.3.3 k-匿名模型
2.3.4 匿名模型实现
2.3.5 等价类
2.4 常见攻击与匿名模型
2.4.1 攻击模式
2.4.2 匿名模型
2.5 匿名评估机制
2.5.1 信息损失
2.5.2 隐私泄露评估
2.6 本章小结
第3章 基于敏感信息邻近抵抗的匿名方法
3.1 (r,k)-匿名模型
3.2 模糊聚类
3.3 距离度量及匿名评估
3.3.1 距离度量
3.3.2 匿名评估度量
3.4 GDPPR算法
3.4.1 算法思想
3.4.2 算法描述
3.4.3 算法实现
3.5 算法分析
3.5.1 正确性分析
3.5.2 数据可用性分析
3.5.3 隐私泄露风险分析
3.5.4 时间复杂度分析
3.6 本章小结
第4章 实验与结果分析
4.1 实验环境
4.2 实验数据集
4.2.1 数据集选取
4.2.2 数据预处理
4.3 Adult数据集
4.3.1 Adult数据集实验结果
4.3.2 Adult数据集可用性分析
4.3.3 Adult数据集泄露风险分析
4.3.4 Adult数据集时间复杂度分析
4.4 Census-Income数据集
4.4.1 Census-Income数据集实验结果
4.4.2 Census-Income数据集可用性分析
4.4.3 Census-Income数据集泄露风险分析
4.4.4 Census-Income数据集时间复杂度分析
4.5 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读学位期间研究成果
致谢
本文编号:3799812
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3799812.html