面向本地差分隐私的数据可用性优化方法研究
发布时间:2023-04-01 16:24
随着大数据和人工智能技术的发展,数据的重要性变得越来越凸显,并被经济学人杂志称为数字时代的石油。然而,随着各国政府日趋严格的隐私保护法案的出台,以及互联网用户隐私保护意识的觉醒,如何在保护隐私的前提下收集数据成为各大互联网公司的当务之急。在学术界和工业界的共同推动下,本地差分隐私技术逐渐成为用户隐私数据收集的黄金标准。目前谷歌、苹果和微软等互联网巨头已把本地差分隐私集成到产品中用于用户隐私数据的收集与分析。本地差分隐私的核心思想是用户在本地对数据进行随机扰动处理,并提供严格的隐私保护量化标准。然而,随机扰动的引入不可避免地影响了数据可用性。如何优化数据可用性成为各大互联网公司大规模部署本地差分隐私需要解决的首要问题。对本地差分隐私数据可用性的优化可以从两个维度展开:融合算法优化和隐私预算优化。其中,融合算法优化通过改进数据编解码方式以降低随机扰动对数据可用性的影响,隐私预算优化在融合算法给定时通过进一步优化隐私保护程度来降低扰动水平。根据数据拥有者与数据使用者之间的关系,隐私预算优化可以分为激励设计和协同优化两种方法。当数据拥有者不是使用者时,可以通过激励设计补偿数据拥有者隐私损失的方...
【文章页数】:151 页
【学位级别】:博士
【文章目录】:
致谢
摘要
Abstract
第一章 绪论
1.1 研究背景
1.1.1 数据隐私及其保护技术
1.1.2 差分隐私技术
1.2 研究现状
1.2.1 融合算法优化
1.2.2 隐私预算优化
1.2.3 现有工作存在的不足
1.3 本文研究内容
1.3.1 研究思路
1.3.2 研究内容
第二章 本地差分隐私定义与理论基础
2.1 差分隐私定义
2.1.1 集中式差分隐私
2.1.2 本地差分隐私
2.1.3 集中式差分隐私与本地差分隐私区别
2.2 频率估计
2.2.1 广义随机响应法
2.2.2 最优一元编码法
2.2.3 最优本地哈希法
2.2.4 方法比较与选择
2.3 均值估计
2.3.1 拉普拉斯机制
2.3.2 杜奇机制
2.3.3 分段机制
2.3.4 方法比较与选择
第三章 高维数据融合算法优化
3.1 引言
3.2 边缘列联表发布问题定义与现有方法总结
3.2.1 问题定义:集中式差分隐私情形
3.2.2 问题定义:本地差分隐私情形
3.2.3 全列联表法
3.2.4 全边缘列联表法
3.2.5 傅里叶变换法
3.2.6 期望最大化法
3.3 本文方法
3.3.1 PriView方法概述
3.3.2 本章提出的CALM方法
3.3.3 视图选取方法
3.3.4 带噪音视图一致性处理方法
3.3.5 复杂度分析
3.3.6 讨论
3.4 性能评估
3.4.1 实验设置
3.4.2 二元数据集性能比较
3.4.3 非二元数据集性能比较
3.4.4 分类性能比较
3.4.5 验证算法参数合理性
3.4.6 k及本地设定对性能的影响
3.5 本章小结
第四章 基于静态激励的隐私预算优化
4.1 引言
4.2 系统模型
4.2.1 群智感知系统概述
4.2.2 静态激励机制工作流程
4.2.3 隐私预算与融合精度定量关系
4.2.4 用户效用定义
4.3 基于契约理论的激励机制设计
4.3.1 契约建模
4.3.2 完全信息下最优契约设计
4.3.3 不完全信息下最优契约设计
4.3.4 讨论
4.4 连续情况扩展
4.5 仿真评估
4.5.1 激励设计优越性评估
4.5.2 激励设计有效性评估
4.6 本章小结
第五章 基于动态激励的隐私预算优化
5.1 引言
5.2 系统模型
5.2.1 群智感知系统模型
5.2.2 激励机制工作流程
5.2.3 反向组合拍卖定义
5.2.4 激励机制设计目标
5.3 动态激励设计问题建模
5.3.1 隐私预算与融合精度之间定量关系
5.3.2 数学模型
5.4 动态激励设计问题求解
5.4.1 在线拍卖转换
5.4.2 在线LPRC拍卖设计
5.4.3 讨论
5.5 在线拍卖机制理论分析
5.6 性能评估
5.6.1 实验设置
5.6.2 性能比较
5.7 本章小结
第六章 基于协同优化的隐私预算优化
6.1 引言
6.2 背景与攻击模型介绍
6.2.1 基本数据库访问协议
6.2.2 攻击模型与假设
6.3 可量化隐私保护机制
6.3.1 二级用户隐私保护机制
6.3.2 一级用户隐私保护机制
6.3.3 防干扰框架
6.4 隐私保护的数据库访问协议
6.4.1 协议概述
6.4.2 二级用户最优决策
6.4.3 一级用户最优决策
6.5 多用户数据库访问协议
6.5.1 信道空闲情形
6.5.2 信道占用情形
6.6 性能评估
6.6.1 实验设置
6.6.2 性能比较
6.7 本章小结
第七章 总结与展望
7.1 全文总结
7.2 研究展望
参考文献
攻读博士学位期间主要研究成果及参与的科研项目
本文编号:3777467
【文章页数】:151 页
【学位级别】:博士
【文章目录】:
致谢
摘要
Abstract
第一章 绪论
1.1 研究背景
1.1.1 数据隐私及其保护技术
1.1.2 差分隐私技术
1.2 研究现状
1.2.1 融合算法优化
1.2.2 隐私预算优化
1.2.3 现有工作存在的不足
1.3 本文研究内容
1.3.1 研究思路
1.3.2 研究内容
第二章 本地差分隐私定义与理论基础
2.1 差分隐私定义
2.1.1 集中式差分隐私
2.1.2 本地差分隐私
2.1.3 集中式差分隐私与本地差分隐私区别
2.2 频率估计
2.2.1 广义随机响应法
2.2.2 最优一元编码法
2.2.3 最优本地哈希法
2.2.4 方法比较与选择
2.3 均值估计
2.3.1 拉普拉斯机制
2.3.2 杜奇机制
2.3.3 分段机制
2.3.4 方法比较与选择
第三章 高维数据融合算法优化
3.1 引言
3.2 边缘列联表发布问题定义与现有方法总结
3.2.1 问题定义:集中式差分隐私情形
3.2.2 问题定义:本地差分隐私情形
3.2.3 全列联表法
3.2.4 全边缘列联表法
3.2.5 傅里叶变换法
3.2.6 期望最大化法
3.3 本文方法
3.3.1 PriView方法概述
3.3.2 本章提出的CALM方法
3.3.3 视图选取方法
3.3.4 带噪音视图一致性处理方法
3.3.5 复杂度分析
3.3.6 讨论
3.4 性能评估
3.4.1 实验设置
3.4.2 二元数据集性能比较
3.4.3 非二元数据集性能比较
3.4.4 分类性能比较
3.4.5 验证算法参数合理性
3.4.6 k及本地设定对性能的影响
3.5 本章小结
第四章 基于静态激励的隐私预算优化
4.1 引言
4.2 系统模型
4.2.1 群智感知系统概述
4.2.2 静态激励机制工作流程
4.2.3 隐私预算与融合精度定量关系
4.2.4 用户效用定义
4.3 基于契约理论的激励机制设计
4.3.1 契约建模
4.3.2 完全信息下最优契约设计
4.3.3 不完全信息下最优契约设计
4.3.4 讨论
4.4 连续情况扩展
4.5 仿真评估
4.5.1 激励设计优越性评估
4.5.2 激励设计有效性评估
4.6 本章小结
第五章 基于动态激励的隐私预算优化
5.1 引言
5.2 系统模型
5.2.1 群智感知系统模型
5.2.2 激励机制工作流程
5.2.3 反向组合拍卖定义
5.2.4 激励机制设计目标
5.3 动态激励设计问题建模
5.3.1 隐私预算与融合精度之间定量关系
5.3.2 数学模型
5.4 动态激励设计问题求解
5.4.1 在线拍卖转换
5.4.2 在线LPRC拍卖设计
5.4.3 讨论
5.5 在线拍卖机制理论分析
5.6 性能评估
5.6.1 实验设置
5.6.2 性能比较
5.7 本章小结
第六章 基于协同优化的隐私预算优化
6.1 引言
6.2 背景与攻击模型介绍
6.2.1 基本数据库访问协议
6.2.2 攻击模型与假设
6.3 可量化隐私保护机制
6.3.1 二级用户隐私保护机制
6.3.2 一级用户隐私保护机制
6.3.3 防干扰框架
6.4 隐私保护的数据库访问协议
6.4.1 协议概述
6.4.2 二级用户最优决策
6.4.3 一级用户最优决策
6.5 多用户数据库访问协议
6.5.1 信道空闲情形
6.5.2 信道占用情形
6.6 性能评估
6.6.1 实验设置
6.6.2 性能比较
6.7 本章小结
第七章 总结与展望
7.1 全文总结
7.2 研究展望
参考文献
攻读博士学位期间主要研究成果及参与的科研项目
本文编号:3777467
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3777467.html