云计算下支持同义多关键词模糊密文检索的方案研究
发布时间:2020-06-29 20:57
【摘要】:云存储通过互联网为用户提供可扩展和弹性的存储服务,是目前云中使用最广泛的应用之一,越来越多的人将关键数据和个人数据外包给云服务器,因此保证这些数据的机密性和完整性至关重要。在外包之前对数据进行加密是保护数据的基本方法,但从加密云中检索所需文件就成为一个问题。可搜索加密技术可以实现在保证用户数据隐私的同时实现对数据的检索服务,其目标是使用户可以通过关键字高效准确的定位到相关的密文文件。已经提出的方案对单关键词和精确检索已实现了较高的检索效率和准确率,但对多关键词模糊检索的实现还不尽人意,目前的模糊搜索方案依靠扩展索引来涵盖可能的关键字拼写错误,这将产生更大的索引文件以及更高的搜索复杂度。本文针对现有密文检索算法的不足,提出了一种在加密云数据中支持同义词及多关键词模糊排序检索方案,该方案通过同时提供基于模糊和同义词的多关键词检索来增强用户搜索体验,使用自然语言处理技术对关键词进行同义词扩展,从而将同义词检索转换为精确匹配,并通过LSH函数族将关键词映射到Bloom Filter来构建索引实现多关键词的模糊检索,同时最小化了动态添加删除文件时更新索引的开销,最后通过内积相关度将检索结果排序,返回给用户最相关的密文文件。本文方案使用哈希算法和安全k-近邻算法来有效抵抗选择关键词攻击,实现了在云服务器半可信情况下对密文的检索。本文的主要工作如下:(1)研究分析了现有的几种多关键词模糊检索方案,通过分析其索引构建、关键词匹配及其密文结果排序方法,给出了各个方案的优势与不足;(2)本文通过对关键词构建同义词集,使用基于局部敏感哈希函数的Bloom Filter构建索引,完成同义模糊匹配,并插入关键词的权重,提升了检索效率和排序的准确性;(3)以安全加密网盘系统为平台,使用python语言实现了在云存储系统下的密文检索,验证了方案的可行性和安全性;(4)基于设计实现的密文检索系统,分析了索引结构与陷门结构的安全性以及构建效率,以真实数据集测试了方案的检索效率,并从理论方面对其安全性和可靠性进行了详细的分析。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP309.7;TP391.3
【图文】:
图 2.6 布隆过滤器误判率敏感哈希函数感哈希函数τLocality Sensitive Hashing思虺
本文编号:2734348
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP309.7;TP391.3
【图文】:
图 2.6 布隆过滤器误判率敏感哈希函数感哈希函数τLocality Sensitive Hashing思虺
本文编号:2734348
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2734348.html