当前位置:主页 > 科技论文 > 软件论文 >

云环境中隐私保护聚类数据挖掘的研究

发布时间:2021-06-07 11:00
  随着数据的爆炸式增长,资源受限的用户在本地进行数据挖掘的任务越来越困难,为了节省成本和提高挖掘效率,用户选择将数据挖掘任务外包给具有强大计算能力和大量存储空间的云服务器。然而,在云环境中对数据进行挖掘时,一些数据的敏感信息会被泄露。因此,如何在保证数据的隐私性不被破坏的情况下来对数据进行挖掘是至关重要的,并且已经成为了一个研究热点。本文将结合密码学相关知识对隐私保护的聚类数据挖掘进行研究,主要做了以下两个方面的工作:1、提出了可动态调整的隐私保护聚类数据挖掘方案。该方案允许云服务器在加密的数据集上动态调整聚类的个数并且恰当选取初始的聚类中心,在保证了数据的隐私性和聚类的精确度的同时也提高了聚类效率。在隐私保护的聚类方案中,由于K均值算法需要提前确定聚类的个数和初始聚类中心,而对于没有经验的数据拥有者需要大量的计算。为此,我们将这些任务交付给具有大量计算的云服务器,以此来减轻数据拥有者的计算负担。数据拥有者采用轻量级的对称加密算法将数据加密后上传到云服务器,云服务器将动态调整聚类个数,并将确定的聚类个数和初始聚类中心发送给数据拥有者。通过对该方案的分析和证明,验证了本方案在减少数据拥有者... 

【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校

【文章页数】:77 页

【学位级别】:硕士

【部分图文】:

云环境中隐私保护聚类数据挖掘的研究


用户-服务器的HE场景

过程图,对称密码算法,加解密,过程图


2/ 1 modmodp qB g Nm NN 系统的加法同态性质可以写成如下形式: pk 1 2 pk 1 pk2Enc m m Enc m Enc m2m 是两个明文消息,“ ”是在相同的公钥 pk 下的加密的密对称密码是指通信的双方使用共同的密钥对数据进行加解密操作。如图 2.2 所示。

总框图,大素数


图 2.3 AES 的总框图2.2 DH 问题(Diffie-Hellman)H 是一种在不安全信道上交换密钥的算法,此算法为 Alice和Bob联合选具体过程如下:1)Alice和Bob确定一个大素数 p ,g 是阶为大素数 p 的乘法循环群G元;2) Alice选取一个秘密指数p1a ,将 modag p 发送给 Bob ,其中ob也秘密选择一个指数p1b ,将 modbg p 发送给 Alice;3) Alice与Bob共享密钥abg 。据离散对数问题,攻击者可能会截获信道上传输的信息 p , g ,ag ,出abg 。2.3 DDH 假设(Decisional Diffie-Hellman)ag 和bg 时,DDH 假设(判定性 Diffie-He

【参考文献】:
期刊论文
[1]差分隐私保护k-means聚类方法研究[J]. 李杨,郝志峰,温雯,谢光强.  计算机科学. 2013(03)
[2]基于MapReduce的Canopy-Kmeans改进算法[J]. 毛典辉.  计算机工程与应用. 2012(27)



本文编号:3216452

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3216452.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bbf85***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com