基于差分隐私的数据发布技术研究
发布时间:2021-05-22 06:11
随着互联网、云计算和人工智能的迅速发展和普及应用,数据的收集和共享日渐频繁,而由此带来的数据隐私问题也愈显尖锐。因此一方面,基于对数据隐私的形式化定义,设计并完善保护用户隐私的策略,具有一定的现实意义;但另一方面,保护隐私的最终目的还是使用数据并产生价值,隐私化数据的可用性不可被忽略。那么在满足隐私需求的前提下,设计合理的数据处理方案来保证数据可用性,是隐私保护研究的重点所在。本文聚焦于数据发布技术,以理论严格且可操作的差分隐私为基础,研究其在不同层面上的隐私保护和数据可用性优化方案。纵观隐私技术相关研究飞速发展的十余年,理论成果和实践应用积淀深厚,然而随着数据化大潮,整个领域仍面临着诸多挑战。挑战一:从数据类型角度来看,连续数据信息量丰富,它的发布对于交通流量分析、人口流动研究、城市环境监测等许多领域都有着重要作用。但这些基于用户个人数据聚合的数据分析稍有不慎就会对用户的个人隐私造成极大的威胁,如日常行为模式等。因此如何在确保用户数据隐私和维持连续数据的信息价值间达到合理平衡,对于整个领域的发展是个巨大挑战。挑战二:从数据提供者的角度来看,在真实的数据收集场景中,不同的数据提供者对于...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:119 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 研究现状及发展趋势
1.2.1 研究现状
1.2.2 发展趋势
1.3 有待解决的关键问题
1.4 本文工作及创新点
1.5 论文组织结构
第2章 相关工作与背景知识
2.1 相关工作
2.1.1 时空数据隐私化
2.1.2 隐私化发布模型
2.1.3 隐私化数据用途
2.2 相关术语与理论基础
2.2.1 集中式差分隐私(DP)
2.2.2 本地化差分隐私(LDP)
第3章 动态化隐私保护的时空数据分组发布方法
3.1 引言
3.2 问题模型
3.2.1 发布模型
3.2.2 数据模型
3.2.3 隐私模型
3.3 时空数据动态发布技术(RGP)
3.3.1 方案描述
3.3.2 算法设计
3.4 技术分析
3.4.1 隐私保护性
3.4.2 数据可用性
3.4.3 效率分析
3.5 实验验证
3.5.1 实验设置
3.5.2 实验结果
3.6 小结与讨论
第4章 多层次个性化隐私保护的数据直方图发布方法
4.1 引言
4.2 系统概述
4.2.1 问题定义
4.2.2 隐私保证
4.2.3 基本模型
4.2.4 效用评价
4.3 优化组合技术(AC)
4.3.1 方法详述
4.3.2 技术分析
4.4 数据复用技术(DRPP)
4.4.1 方法详述
4.4.2 技术分析
4.4.3 性能对比
4.5 组合复用方案(RCF)
4.5.1 方法详述
4.5.2 技术分析
4.6 实验仿真
4.6.1 实验设置
4.6.2 实验结果
4.7 小结与讨论
第5章 基于多种隐私模型的分类器发布方法
5.1 引言
5.2 系统描述
5.2.1 问题定义
5.2.2 隐私模型
5.2.3 评价标准
5.3 基于随机应答机制的分类器训练技术
5.3.1 方案详述
5.3.2 技术分析
5.4 基于1-bit通信机制的分类器训练技术
5.4.1 方案详述
5.4.2 技术分析
5.5 基于几何分布的数值扰动技术
5.5.1 方案详述
5.5.2 技术分析
5.6 实验仿真
5.6.1 参数设置
5.6.2 实验结果
5.7 小结与讨论
第6章 总结与展望
6.1 本文工作总结
6.2 未来研究工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
本文编号:3201134
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:119 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 研究现状及发展趋势
1.2.1 研究现状
1.2.2 发展趋势
1.3 有待解决的关键问题
1.4 本文工作及创新点
1.5 论文组织结构
第2章 相关工作与背景知识
2.1 相关工作
2.1.1 时空数据隐私化
2.1.2 隐私化发布模型
2.1.3 隐私化数据用途
2.2 相关术语与理论基础
2.2.1 集中式差分隐私(DP)
2.2.2 本地化差分隐私(LDP)
第3章 动态化隐私保护的时空数据分组发布方法
3.1 引言
3.2 问题模型
3.2.1 发布模型
3.2.2 数据模型
3.2.3 隐私模型
3.3 时空数据动态发布技术(RGP)
3.3.1 方案描述
3.3.2 算法设计
3.4 技术分析
3.4.1 隐私保护性
3.4.2 数据可用性
3.4.3 效率分析
3.5 实验验证
3.5.1 实验设置
3.5.2 实验结果
3.6 小结与讨论
第4章 多层次个性化隐私保护的数据直方图发布方法
4.1 引言
4.2 系统概述
4.2.1 问题定义
4.2.2 隐私保证
4.2.3 基本模型
4.2.4 效用评价
4.3 优化组合技术(AC)
4.3.1 方法详述
4.3.2 技术分析
4.4 数据复用技术(DRPP)
4.4.1 方法详述
4.4.2 技术分析
4.4.3 性能对比
4.5 组合复用方案(RCF)
4.5.1 方法详述
4.5.2 技术分析
4.6 实验仿真
4.6.1 实验设置
4.6.2 实验结果
4.7 小结与讨论
第5章 基于多种隐私模型的分类器发布方法
5.1 引言
5.2 系统描述
5.2.1 问题定义
5.2.2 隐私模型
5.2.3 评价标准
5.3 基于随机应答机制的分类器训练技术
5.3.1 方案详述
5.3.2 技术分析
5.4 基于1-bit通信机制的分类器训练技术
5.4.1 方案详述
5.4.2 技术分析
5.5 基于几何分布的数值扰动技术
5.5.1 方案详述
5.5.2 技术分析
5.6 实验仿真
5.6.1 参数设置
5.6.2 实验结果
5.7 小结与讨论
第6章 总结与展望
6.1 本文工作总结
6.2 未来研究工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
本文编号:3201134
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3201134.html