基于MapReduce可搜索加密的排序方案
发布时间:2017-08-18 10:11
本文关键词:基于MapReduce可搜索加密的排序方案
更多相关文章: 云计算 可搜索加密 相关度排序 MapReduce
【摘要】:互联网的高速发展使得人们越来越倾向于将信息存储在网络上,而云服务器的高存储能力也吸引了越来越多的用户进行数据存储,与此同时,用户也开始越来越重视自己的个人隐私及数据安全。最简单保护数据安全的方式是数据拥有者将数据先进行加密处理,再存储到云服务器上。但是将会带来如何在密文上进行检索的难题。因此,对密文数据的高效搜索成了热门的研究领域,现在比较普遍的解决方案就是使用可搜索加密机制。而大多数的可搜索加密方案基本上是将搜索到的符合条件的所有结果都返还给用户,并没有对其进行筛选或排序。为数不多的几个可搜索加密排序方案没有考虑用户下载后反馈以及不同关键字初始的权重有可能不一样这两个问题,而且它们的权重计算和建立索引都是由数据所有者完成。这样使得可搜索加密排序方案并没能高效、准确的完成。 TF/IDF作为一种统计方法,经常应用于资讯检索与文本挖掘的领域,它可以衡量一个关键字对于一个文件集中的某一文件的重要程度。TF/IDF的各种形式之所以在搜索引擎中得到广泛应用,是因为它是一种简单有效的度量方式,可以用来评估用户查询的关键字与文件之间的相关度大小。相关度的大小与查询的关键字在一个文件中的出现的频率成正比,与在文件集中出现的频率成反比,这一特性就可以帮助我们用来区别文档。 作为一种可以解决海量数据上计算问题的分布式计算模型,MapReduce主要应用于搜索领域。MapReduce分为两个处理阶段:Map和Reduce。Map的主要作用是在海量数据集上进行分解操作,而Reduce是将分解后得到的中间值进行归约,从而得到最终的结果。 为了能够高效的实现密文检索,同时能够保证安全、可靠的将结果进行排序,本文借助MapReduce来实现可搜索加密的排序方案。 本文的主要研究成果如下: (1)提出了一个基于MapReduce对称可搜索加密的排序方案,,由数据拥有者计算关键字相关度,云服务器按其相关度进行排序后,返回给用户前k个搜索结果。 (2)在原方案上进行改进,提出一个改进方案。该方案考虑到关键字初始权重不同,修改权重设定;将关键字相关度的部分计算放到服务器端进行,为数据拥有者减少本地计算开销;考虑安全因素,使用相对词频代替真实词频;增加反馈机制,更加贴合用户所需。 (3)在Hadoop平台的编程模型MapReduce上设计并实现上述两个方案。通过分析和对比原始方案和改进方案,可以看出改进方案更加符合用户要求。
【关键词】:云计算 可搜索加密 相关度排序 MapReduce
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP309.7
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-15
- 1.1 研究的背景和意义10-11
- 1.2 国内外发展现状11-13
- 1.2.1 可搜索加密的发展11-12
- 1.2.2 密文排序的现状12-13
- 1.3 本文主要内容13-14
- 1.4 本文内容安排14-15
- 第2章 相关研究15-28
- 2.1 可搜索加密15-20
- 2.1.1 对称可搜索加密16-19
- 2.1.2 公钥可搜索加密19-20
- 2.2 TF/IDF20-21
- 2.3 开源云计算平台 Hadoop21-26
- 2.3.1 分布式文件系统 HDFS21-22
- 2.3.2 并行编程模型 MapReduce22-26
- 2.4 本章小结26-28
- 第3章 基于 MapReduce 对称可搜索加密的排序方案设计28-37
- 3.1 方案需求分析28-29
- 3.2 基本方案29-32
- 3.2.1 符号约定29
- 3.2.2 算法定义29-30
- 3.2.3 方案设计30-32
- 3.3 改进方案32-36
- 3.3.1 改进方案的提出32-33
- 3.3.2 相关度计算33-34
- 3.3.3 符号约定34-35
- 3.3.4 算法定义35-36
- 3.4 本章小结36-37
- 第4章 方案的实现及分析37-44
- 4.1 试验环境37
- 4.2 试验实现37-41
- 4.2.1 数据拥有者操作37-40
- 4.2.2 服务器操作40-41
- 4.3 实验评价41-43
- 4.3.1 评价指标41-42
- 4.3.2 实验结果42-43
- 4.4 算法评价43
- 4.5 本章小结43-44
- 第5章 总结与展望44-46
- 5.1 论文总结44-45
- 5.2 工作展望45-46
- 参考文献46-50
- 作者简介及硕士期间科研成果50-51
- 致谢51
【参考文献】
中国期刊全文数据库 前1条
1 程芳权;彭智勇;宋伟;王书林;崔一辉;;云环境下一种隐私保护的高效密文排序查询方法[J];计算机学报;2012年11期
本文编号:694002
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/694002.html