当前位置:主页 > 科技论文 > 软件论文 >

云环境下面向隐私保护的密度峰聚类方法研究

发布时间:2021-02-02 17:55
  在数字化、虚拟化、信息化的发展进程中,各种移动终端和服务器每时每刻都在产生海量的数据。随着云计算的日益普及,云计算技术在数据处理方面提供了强大的计算能力,越来越多的企业将数据存储在云服务器中以节省经济成本。数据挖掘技术可以从海量数据中发现并提取出具有关键价值的信息,然而在云计算环境中进行数据挖掘时,数据中的隐私信息可能会被泄露。因此,如何在保护隐私的同时挖掘出数据中有用的信息具有一定的研究意义。针对聚类挖掘中的隐私保护进行研究,本文主要工作包括以下两个方面:一是每个参与方需要对隐私数据进行加密,并对密文进行安全划分之后上传给云服务器,云服务器对密文进行聚类分析,再把聚类结果返回给用户;二是采用混合云方式帮助用户完成安全计算的任务,解决聚类中的隐私保护会给用户带来额外的计算开销问题。公有云和私有云共同操作,私有云提供秘钥,公有云完成聚类分析。相关研究成果如下:(1)针对在云计算环境下用户隐私信息以及云服务器在聚类过程产生的中间信息可能被泄露的问题,提出一种云计算中的隐私保护密度峰聚类算法,提高聚类的安全性和可用性。首先,云服务商在用户隐私数据未知的情况下计算聚类中心,并且不会泄漏任何聚类... 

【文章来源】:安徽师范大学安徽省

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

云环境下面向隐私保护的密度峰聚类方法研究


不同数据集规模上PPDPC算法的加密时间

算法,数据集


26对于五个样本数量较小的UCI数据集,PPDPC算法与对比算法的运行时间如图3.4所示。PPDPC算法的运行时间比对比算法的运行时间短,并且与原始DPC算法的运行时间相比没有明显增加。图3.4不同数据集上PPDPC算法对比算法的运行时间针对这8个数据集,PPDPC算法与对比算法的运行时间如表3.4所示。由表3.4可见,PPDPC算法相较DPC算法运行时间有所增加,但均不超过15.9%,并且都没有超过K-means和SC算法的运行时间。对于数据集Iris,PPDPC算法的运行时间较K-means算法降低了52.1%;对于数据集Wpbc,PPDPC算法的运行时间较SC算法降低了29.3%;对于数据集German,PPDPC算法的运行时间较SC算法降低了20.8%;对于数据集Adult,PPDPC算法的运行时间较K-means算法降低了29.1%;对于数据集MobileUser,PPDPC算法的运行时间较SC算法降低了15.9%;对于数据集LendingClub,PPDPC算法的运行时间较K-means算法降低了13.2%。表3.4PPDPC算法与对比算法的运行时间数据集K-meansSCDPCPPDPCIris0.72s0.56s0.21s0.34sWpbc3.13s3.52s2.25s2.49sHeart2.36s1.75s0.87s1.03sBalance2.79s1.94s1.05s1.42sGerman6.35s6.54s4.29s5.18sAdult131.25s124.16s103.92s112.37sMobileUser19.69min17.87min16.52min16.94minLendingClub280.12min256.65min239.83min243.14min

数据集,算法


39(a)Heart(b)Balance(c)Vote(d)Zoo(e)Wpbc(f)Vehicle(g)Adult(h)HLF图4.2不同数据集上PPDPC算法对比算法的运行时间


本文编号:3015128

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3015128.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户76b5a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com