差分隐私合成数据研究
本文选题:隐私保护 切入点:数据发布 出处:《安徽理工大学》2016年硕士论文 论文类型:学位论文
【摘要】:过去的几十年里,互联网的发展彻底改变了我们的生活方式。网络也逐渐成为人们生活的中心,网上购物、查资料、看新闻逐渐成为人们日常生活离不开的一部分。这种日常生活的网络化塑造了一个网络时代和一大批与我们息息相关的互联网公司。这些互联网公司往往提供优质而免费的服务,并且拥有巨量的用户和资源。互联网技术的飞速发展,网络为各种数据的发布、采集、存储和分析带来了一定的便捷。比如医疗单位长时间建立的患者诊断数据集记录,电子商务网站收集的用户个人基本信息等。对这些数据进行大量挖掘分析能够得到大量的关于现实生活的许多有用信息。但这些数据中通常会包含很多个人隐私信息,直接发布有利于数据挖掘分析的实现,但将给个人隐私信息带来一定的威胁,因此,为了更好的解决好这个矛盾,数据发布中的隐私保护技术问题引起了学术界广泛的研究和探讨。近年来,我们已经目睹了多起用户隐私泄漏事件,多家公司深陷其中;而这些事件全都是由于数据拥有者分享数据不当引起的。因此,如何保护数据发布中的隐私问题也成为一项引人注目的话题。本文主要研究了如何在基于差分隐私保护条件下有效发布合成数据集技术,文中对隐私保护、差分隐私保护领域已有的研究成果进行了总结概述,对隐私保护领域内的基本原理和特征进行了阐述,通过研究现今几种差分隐私数据集发布技术,对比总结,最终分析和提出了一种基于差分隐私的分类数据匿名化合成发布方案,使得在基于差分隐私保护条件下分类数据匿名化发布技术既能够保护用户的隐私信息,又不影响数据的可用性,达到了研究的目的。在数据发布方面,分析介绍了交互式和非交互式两种差分隐私保护数据发布方法,并着重从精确度和样本复杂度的角度对这些方法进行分析和对比,介绍了各种非交互式方式下数据发布技术。本文以理论分析为基础,综合实验平台,对提出的一种分类数据合成匿名化发布技术进行实验设计、实验数据论证,其实验结果表明:当发布数据集满足一定条件时,通过添加更少的噪音,可以达到降低源数据的失真程度和提高数据可用性的目的,使得数据的可用性和隐私性相结合达到更好的平衡,从而实现了差分隐私保护条件下数据发布技术。
[Abstract]:In the past few decades, the development of the Internet has completely changed our way of life. The Internet has gradually become the center of people's lives. Watching news is becoming a part of people's daily life. The network of daily life has shaped a network era and a large number of internet companies which are closely related to us. These internet companies often provide the best. Quality and free service, With the rapid development of Internet technology, the network has brought a certain convenience for the release, collection, storage and analysis of various data, such as the patient diagnosis data set records established by medical units for a long time. A lot of useful information about real life can be obtained by mining and analyzing these data. But these data usually contain a lot of personal privacy information. Direct release is beneficial to the realization of data mining and analysis, but it will bring a certain threat to personal privacy information. Therefore, in order to better solve this contradiction, Privacy protection technology in data release has caused extensive research and discussion in academic circles. In recent years, we have witnessed a number of user privacy leaks, many companies are trapped in it; These events are all caused by improper sharing of data by data owners. How to protect the privacy in data release has also become a noticeable topic. This paper mainly studies how to effectively publish composite data sets under the condition of differential privacy protection, and how to protect privacy in this paper. This paper summarizes the existing research achievements in the field of differential privacy protection, expounds the basic principles and characteristics in the field of privacy protection, and compares and summarizes several kinds of differential privacy data set publishing techniques. Finally, this paper analyzes and proposes a scheme of classified data anonymous composition and release based on differential privacy, which can protect the privacy information of users under the condition of classified data anonymous publishing under the condition of differential privacy protection. At the same time, it does not affect the availability of data, and achieves the purpose of research. In the aspect of data release, two kinds of interactive and non-interactive differential privacy protection data publishing methods are analyzed and introduced. This paper analyzes and compares these methods from the angle of accuracy and sample complexity, and introduces the techniques of data release in various non-interactive ways. This paper is based on theoretical analysis and synthesizes the experimental platform. An experimental design of a classified data synthesis and anonymous publishing technique is carried out. The experimental data demonstrate that: when the published data set meets certain conditions, less noise is added to the data set. It can reduce the distortion of source data and improve the availability of data, and make the combination of data availability and privacy achieve a better balance, thus realizing the technology of data release under the condition of differential privacy protection.
【学位授予单位】:安徽理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP309
【相似文献】
相关期刊论文 前10条
1 ;守住你的秘密——隐私保护神[J];计算机与网络;2002年05期
2 李学聚;;新时期读者隐私保护探析[J];科技情报开发与经济;2006年13期
3 管重;;谁偷窥了你的隐私[J];数字通信;2007年15期
4 孔为民;;大学图书馆与隐私保护[J];科技情报开发与经济;2007年26期
5 尹凯华;熊璋;吴晶;;个性化服务中隐私保护技术综述[J];计算机应用研究;2008年07期
6 高枫;张峰;周伟;;网络环境中的隐私保护标准化研究[J];电信科学;2013年04期
7 高密;薛宝赏;;我的电脑信息 隐私保护很强大[J];网友世界;2010年11期
8 ;为自己的电子商务设计隐私保护[J];个人电脑;2000年07期
9 ;隐私保护的10个准则[J];个人电脑;2000年07期
10 岑婷婷;韩建民;王基一;李细雨;;隐私保护中K-匿名模型的综述[J];计算机工程与应用;2008年04期
相关会议论文 前10条
1 郑思琳;陈红;叶运莉;;实习护士病人隐私保护意识和行为调查分析[A];中华护理学会第8届全国造口、伤口、失禁护理学术交流会议、全国外科护理学术交流会议、全国神经内、外科护理学术交流会议论文汇编[C];2011年
2 孙通源;;基于局部聚类和杂度增益的数据信息隐私保护方法探讨[A];中国水利学会2013学术年会论文集——S4水利信息化建设与管理[C];2013年
3 张亚维;朱智武;叶晓俊;;数据空间隐私保护平台的设计[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 公伟;隗玉凯;王庆升;胡鑫磊;李换双;;美国隐私保护标准及隐私保护控制思路研究[A];2013年度标准化学术研究论文集[C];2013年
5 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 桂琼;程小辉;;一种隐私保护的分布式关联规则挖掘方法[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
7 俞笛;徐向阳;解庆春;刘寅;;基于保序加密的隐私保护挖掘算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
8 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 徐振龙;郭崇慧;;隐私保护数据挖掘研究的简要综述[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年
10 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
相关重要报纸文章 前10条
1 记者 李舒瑜;更关注隐私保护和人格尊重[N];深圳特区报;2011年
2 荷兰鹿特丹医学中心博士 吴舟桥;荷兰人的隐私[N];东方早报;2012年
3 本报记者 周静;私密社交应用风潮来袭 聚焦小众隐私保护是关键[N];通信信息报;2013年
4 独立分析师 陈志刚;隐私管理应归个人[N];通信产业报;2013年
5 本报记者 朱宁宁;商业利益与隐私保护需立法平衡[N];法制日报;2014年
6 袁元;手机隐私保护萌发商机[N];证券日报;2014年
7 王尔山;跟隐私说再见[N];21世纪经济报道;2008年
8 记者 武晓黎;360安全浏览器推“隐私浏览”模式[N];中国消费者报;2008年
9 早报记者 是冬冬;“美国隐私保护法律已过时”[N];东方早报;2012年
10 张晓明;隐私的两难[N];电脑报;2013年
相关博士学位论文 前10条
1 孟祥旭;基于位置的移动信息服务技术与应用研究[D];国防科学技术大学;2013年
2 兰丽辉;基于向量模型的加权社会网络发布隐私保护方法研究[D];江苏大学;2015年
3 柯昌博;云服务组合隐私分析与保护方法研究[D];南京航空航天大学;2014年
4 李敏;基于位置服务的隐私保护研究[D];电子科技大学;2014年
5 陈东;信息物理融合系统安全与隐私保护关键技术研究[D];东北大学;2014年
6 张柯丽;信誉系统安全和隐私保护机制的研究[D];北京邮电大学;2015年
7 Kamenyi Domenic Mutiria;[D];电子科技大学;2014年
8 孙崇敬;面向属性与关系的隐私保护数据挖掘理论研究[D];电子科技大学;2014年
9 刘向宇;面向社会网络的隐私保护关键技术研究[D];东北大学;2014年
10 高胜;移动感知计算中位置和轨迹隐私保护研究[D];西安电子科技大学;2014年
相关硕士学位论文 前10条
1 邹朝斌;SNS用户隐私感知与自我表露行为的关系研究[D];西南大学;2015年
2 李汶龙;大数据时代的隐私保护与被遗忘权[D];中国政法大学;2015年
3 孙琪;基于位置服务的连续查询隐私保护研究[D];湖南工业大学;2015年
4 尹惠;无线传感器网络数据融合隐私保护技术研究[D];西南交通大学;2015年
5 王鹏飞;位置服务中的隐私保护技术研究[D];南京理工大学;2015年
6 顾铖;基于关联规则的隐私保护算法研究[D];南京理工大学;2015年
7 崔尧;基于匿名方案的位置隐私保护技术研究[D];西安工业大学;2015年
8 毕开圆;社会网络中用户身份隐私保护模型的研究[D];大连海事大学;2015年
9 黄奚芳;基于差分隐私保护的集值型数据发布技术研究[D];江西理工大学;2015年
10 高超;具有隐私保护意识的大样本双盲随机对照试验数据管理系统的设计与实现[D];山东大学;2015年
,本文编号:1632435
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1632435.html