当前位置:主页 > 科技论文 > 软件论文 >

基于差分隐私的K-means聚类分析

发布时间:2017-11-28 13:26

  本文关键词:基于差分隐私的K-means聚类分析


  更多相关文章: 数据挖掘 隐私保护 差分隐私 聚类 组推荐 群组发现


【摘要】:数据挖掘能够发现隐藏在海量数据背后的潜在模式以及规则,有利于我们更好的作出决策,被广泛应用于商业、科学研究以及医学研究等领域,但是如果对数据挖掘利用不当,可能会对隐私和信息安全构成威胁,因此如何将隐私保护技术与数据挖掘结合,实现保证隐私安全前提下的数据挖掘成为数据挖掘领域的研究热点之一早期的隐私保护模型如K-匿名及其扩展模型,通常需要假设可能的攻击模型,旦出现新型攻击,必须不断改进自身模型,而且无法对隐私保护水平进行量化分析,因此Dwork提出了的差分隐私隐私保护模型。差分隐私保护模型定义了一种更为严格的最大背景知识作为它的攻击模型,以坚实的数学理论为支撑,能够通过参数ε量化隐私保护水平,弥补了传统隐私保护的不足,且其添加的噪声量大小与数据集无关,因此非常适合海量数据挖掘中的隐私保护。传统差分隐私保护K-means算法,对其初始中心点的选择较为敏感,而且在聚簇个数k值的选择上存在一定的盲目性,降低了聚类结果的可用性。因此,本文在差分隐私保护K-means中引入Canopy算法,提出了融合Canopy的差分隐私保护K-Means算法,即DP Canopy K-means算法。DP Canopy K-means算法能有效避免k值盲目性和初始点敏感性,并且能减少其迭代次数,提高聚类结果的可用性,能够应用于数据挖掘中对原始数据隐私保护和聚类结果可用性有要求的场景中。PINQ是最早为敏感数据查询提供差分隐私保护的原型系统,本文基于PINQ平台实现了DP Canopy K-means算法和IDP K-means算法,并且比较这两种算法在Magic和Blood数据集上运行的聚类结果可用性。实验结果表明,在同样的隐私保护水平下,DP Canopy K-means算法的聚类结果在准确性上优于IDP K-means算法,在收敛速度上DP Canopy K-means算法高于传统DP K-means算法。为了验证算法在实际应用中的有效性,论文以组推荐系统为应用场景,分析了组推荐系统中的隐私泄露问题,通过在组推荐算法中引入了DP Canopy K-means算法保证用户隐私安全。实验结果证明,在组推荐中应用DP Canopy K-means算法不会对推荐准确度产生大幅度的影响,在一定隐私预算值下,误差不超过3%,能够获得推荐系统中隐私保护与推荐结果的平衡。
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP309

【相似文献】

中国期刊全文数据库 前10条

1 李学聚;;新时期读者隐私保护探析[J];科技情报开发与经济;2006年13期

2 管重;;谁偷窥了你的隐私[J];数字通信;2007年15期

3 孔为民;;大学图书馆与隐私保护[J];科技情报开发与经济;2007年26期

4 尹凯华;熊璋;吴晶;;个性化服务中隐私保护技术综述[J];计算机应用研究;2008年07期

5 高枫;张峰;周伟;;网络环境中的隐私保护标准化研究[J];电信科学;2013年04期

6 高密;薛宝赏;;我的电脑信息 隐私保护很强大[J];网友世界;2010年11期

7 ;为自己的电子商务设计隐私保护[J];个人电脑;2000年07期

8 ;隐私保护的10个准则[J];个人电脑;2000年07期

9 岑婷婷;韩建民;王基一;李细雨;;隐私保护中K-匿名模型的综述[J];计算机工程与应用;2008年04期

10 郑悦;;犹抱隐私半遮面[J];中国计算机用户;2008年14期

中国重要会议论文全文数据库 前10条

1 郑思琳;陈红;叶运莉;;实习护士病人隐私保护意识和行为调查分析[A];中华护理学会第8届全国造口、伤口、失禁护理学术交流会议、全国外科护理学术交流会议、全国神经内、外科护理学术交流会议论文汇编[C];2011年

2 孙通源;;基于局部聚类和杂度增益的数据信息隐私保护方法探讨[A];中国水利学会2013学术年会论文集——S4水利信息化建设与管理[C];2013年

3 张亚维;朱智武;叶晓俊;;数据空间隐私保护平台的设计[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

4 公伟;隗玉凯;王庆升;胡鑫磊;李换双;;美国隐私保护标准及隐私保护控制思路研究[A];2013年度标准化学术研究论文集[C];2013年

5 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

6 桂琼;程小辉;;一种隐私保护的分布式关联规则挖掘方法[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年

7 俞笛;徐向阳;解庆春;刘寅;;基于保序加密的隐私保护挖掘算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

8 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

9 徐振龙;郭崇慧;;隐私保护数据挖掘研究的简要综述[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年

10 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

中国重要报纸全文数据库 前10条

1 记者 李舒瑜;更关注隐私保护和人格尊重[N];深圳特区报;2011年

2 荷兰鹿特丹医学中心博士 吴舟桥;荷兰人的隐私[N];东方早报;2012年

3 本报记者 周静;私密社交应用风潮来袭 聚焦小众隐私保护是关键[N];通信信息报;2013年

4 独立分析师 陈志刚;隐私管理应归个人[N];通信产业报;2013年

5 本报记者 朱宁宁;商业利益与隐私保护需立法平衡[N];法制日报;2014年

6 袁元;手机隐私保护萌发商机[N];证券日报;2014年

7 王尔山;跟隐私说再见[N];21世纪经济报道;2008年

8 记者 武晓黎;360安全浏览器推“隐私浏览”模式[N];中国消费者报;2008年

9 早报记者 是冬冬;“美国隐私保护法律已过时”[N];东方早报;2012年

10 张晓明;隐私的两难[N];电脑报;2013年

中国博士学位论文全文数据库 前10条

1 孟祥旭;基于位置的移动信息服务技术与应用研究[D];国防科学技术大学;2013年

2 兰丽辉;基于向量模型的加权社会网络发布隐私保护方法研究[D];江苏大学;2015年

3 柯昌博;云服务组合隐私分析与保护方法研究[D];南京航空航天大学;2014年

4 李敏;基于位置服务的隐私保护研究[D];电子科技大学;2014年

5 陈东;信息物理融合系统安全与隐私保护关键技术研究[D];东北大学;2014年

6 张柯丽;信誉系统安全和隐私保护机制的研究[D];北京邮电大学;2015年

7 Kamenyi Domenic Mutiria;[D];电子科技大学;2014年

8 孙崇敬;面向属性与关系的隐私保护数据挖掘理论研究[D];电子科技大学;2014年

9 刘向宇;面向社会网络的隐私保护关键技术研究[D];东北大学;2014年

10 高胜;移动感知计算中位置和轨迹隐私保护研究[D];西安电子科技大学;2014年

中国硕士学位论文全文数据库 前10条

1 孙琪;基于位置服务的连续查询隐私保护研究[D];湖南工业大学;2015年

2 任旭;论刑事公开审判中的个人隐私保护[D];燕山大学;2015年

3 武发明;位置服务隐私安全保护系统的设计与实现[D];上海交通大学;2015年

4 李越川;基于超图模型的隐私保护匿名化技术研究[D];北京交通大学;2016年

5 王小妮;可穿戴传感器网络中数据隐私保护技术的研究[D];北京交通大学;2016年

6 周晓湄;基于SEAndroid的安卓隐私保护系统[D];中国海洋大学;2015年

7 倪川;支持协作危机管理的ABAC扩展模型研究[D];南京航空航天大学;2015年

8 杨凤娇;基于敏感隐私保护度的K-匿名算法研究[D];天津财经大学;2015年

9 王鑫圣;针对全邻域关系攻击的隐私保护模型的分析与设计[D];大连海事大学;2016年

10 孔玲慧;大数据时代的公民隐私保护[D];上海交通大学;2015年



本文编号:1234135

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1234135.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c30bd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com