支持多关键字可排序的高性能可搜索加密系统及其应用
发布时间:2020-03-28 22:05
【摘要】:随着智能终端和移动互联网的发展,许多用户倾向于将数据存储在云端,云环境中的隐私保护技术得到了越来越多的关注和研究。为了保护数据拥有者的隐私,这些数据应该加密后再外包给云服务器,然而传统的加密会导致文本数据难以搜索。为了解决密文域上信息检索的问题,近几年提出了很多关于可搜索加密的研究方案,现有的方案有些无法支持关键词权重,有些使用线性搜索,有些不支持权限控制。大多数模糊搜索方案仅仅支持英文模糊搜索。总而言之,目前的可搜索加密方案性能较差、功能不齐、只有理论研究,没有实际应用。针对上述问题,本文实现了一个支持多关键字可排序的高性能可搜索加密系统,适用于在云环境下保护用户的隐私。本文主要工作如下:(1)为了解决现有可搜索加密方案性能较低的问题,我们提出“高性能secure KNN”算法,对密钥结构进行修改,在没有降低安全级别的前提下使算法性能大幅度提升,并给出详细的安全性证明。(2)为了实现多关键字、高性能搜索,我们把Xia等人方案与本文提出的“高性能secure KNN”算法结合,大幅度提升密文索引建立速度,并使用向空间模型和TF-IDF值建立树形索引,使得搜索复杂度降低到亚线性级别。(3)为了弥补密文索引搜索算法在最坏情况下搜索性能和精度大幅度降低的缺陷,我们对贪婪的深度优先搜索算法(GDFS)进行改进并提出“改进贪婪的深度优先搜索算法(EGDFS)”,使其在任何情况下都能准确高效搜索。(4)为了实现可排序,我们对结果集中的文件按照相似度进行排序。(5)为了解决五笔输入法的用户误输入问题,我们提出预设形近字表的方式实现了密文域上基于形近字的中文模糊搜索。此外,本文还进行了大对比实验。性能对比结果表明,本文提出方案能够有效的提升密钥生成阶段、密文索引生成阶段、陷门生成阶段以及查询阶段的性能。系统整体测试结果表明,本文系统能够在真实云环境下保护用户隐私。最后阐述本文研究并实现的系统能够应用在安全云存储领域和群体感知领域,并解决隐私保护的难题。
【图文】:
整个系统分为四大模块,分别是云服务器(不可信)查询用户、数据采集用户。在本系统中,智能终端通常是一些设备,他们会主动上传数据给数据拥有者,而这些数据通常是这些明文文件提取关键词后建立索引,再用对称加密算法将明搜索加密算法加密明文索引,然后把密文文件和密文索引一起在搜索阶段,查询用户通过安全信道与数据拥有者进行交互,据拥有者,数据拥有者将用户查询转化成陷门返回给用户,同密钥也一并发送给用户。用户将收到的陷门提交给服务器,服和数据拥有者之前上传的密文索引进行相关度计算,并对结果关的结果返回给用户,用户使用对称密钥对文件进行解密即可
图 4-1 可搜索加密系统架构加密模块:其下分为两个加密子模块,分别为文件加密模块和索引加密模块。其中件加密模块使用的是对称加密算法 AES 对文件进行加密,索引加密模块使用的是本提出的“高性能 secure KNN”进行索引加密。索引生成模块:对整个文件集合进行预处理,提取所有文件中的关键字,构建关键字典,然后将文件中出现过的关键字对应位置置为 1(或者 TF-IDF 值),其他置为 0,成文件向 ,再对所有文件向 使用构建索引算法生成索引。数据采集模块:数据采集用户通过主动上传或者被动感知的方式采集数据,数据拥者通过数据采集模块获取用户数据。陷门生成模块:搜索用户将搜索关键字提交给数据拥有者,陷门生成模块会根据用提交的关键词执行陷门生成算法产生查询陷门,并将陷门通过安全信道发送给查询用。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP309.7
【图文】:
整个系统分为四大模块,分别是云服务器(不可信)查询用户、数据采集用户。在本系统中,智能终端通常是一些设备,他们会主动上传数据给数据拥有者,而这些数据通常是这些明文文件提取关键词后建立索引,再用对称加密算法将明搜索加密算法加密明文索引,然后把密文文件和密文索引一起在搜索阶段,查询用户通过安全信道与数据拥有者进行交互,据拥有者,数据拥有者将用户查询转化成陷门返回给用户,同密钥也一并发送给用户。用户将收到的陷门提交给服务器,服和数据拥有者之前上传的密文索引进行相关度计算,并对结果关的结果返回给用户,用户使用对称密钥对文件进行解密即可
图 4-1 可搜索加密系统架构加密模块:其下分为两个加密子模块,分别为文件加密模块和索引加密模块。其中件加密模块使用的是对称加密算法 AES 对文件进行加密,索引加密模块使用的是本提出的“高性能 secure KNN”进行索引加密。索引生成模块:对整个文件集合进行预处理,提取所有文件中的关键字,构建关键字典,然后将文件中出现过的关键字对应位置置为 1(或者 TF-IDF 值),其他置为 0,成文件向 ,再对所有文件向 使用构建索引算法生成索引。数据采集模块:数据采集用户通过主动上传或者被动感知的方式采集数据,数据拥者通过数据采集模块获取用户数据。陷门生成模块:搜索用户将搜索关键字提交给数据拥有者,陷门生成模块会根据用提交的关键词执行陷门生成算法产生查询陷门,并将陷门通过安全信道发送给查询用。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP309.7
【参考文献】
相关期刊论文 前1条
1 陈何峰;林柏钢;杨e,
本文编号:2604976
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2604976.html