当前位置:主页 > 科技论文 > 软件论文 >

加密云数据下基于Simhash的模糊排序搜索方案

发布时间:2018-05-30 15:00

  本文选题:云计算 + 加密云数据 ; 参考:《计算机学报》2017年02期


【摘要】:为了保护数据隐私,数据拥有者会将敏感数据的密文外包到云服务器,这使得传统明文搜索技术难以使用.因此可搜索加密技术被用于对密文数据进行搜索,实现高效的数据利用.然而目前在加密云数据中,关键词模糊搜索方案主要是通过构造关键词模糊集合来实现,其需要大量的计算和存储开销.本文提出的搜索方案,无需构造关键词模糊集合,而是基于Simhash的降维思想,将文档关键词做n-gram处理并得到Simhash指纹来实现模糊搜索.该文结合汉明距离和关键词相关度分数,设计了双因子排序算法对查询结果进行排序.使用树索引结构和新型遍历方法进一步提高了搜索效率.通过新型遍历方法,即使树的节点值与期望值不相等,也能够对树进行遍历.理论分析和实验结果表明:该方案实现了加密云数据下的关键词模糊搜索,同时极大地节约了时间和空间成本.
[Abstract]:In order to protect data privacy, data owners outsource ciphertext of sensitive data to cloud servers, which makes it difficult for traditional plaintext search technology to use. Therefore searchable encryption technology is used to search ciphertext data to achieve efficient data utilization. However, in encrypted cloud data, keyword fuzzy search scheme is mainly implemented by constructing fuzzy set of keywords, which requires a large amount of computation and storage overhead. The search scheme proposed in this paper does not need to construct the fuzzy set of keywords, but based on the dimensionality reduction idea of Simhash, the document keywords are processed by n-gram and the Simhash fingerprint is obtained to realize the fuzzy search. Combining hamming distance and keyword correlation score, a two-factor sorting algorithm is designed to sort the query results. The search efficiency is further improved by using tree index structure and new traversal method. Through the new traversal method, the tree can be traversed even if the node value is not equal to the expected value. The theoretical analysis and experimental results show that the proposed scheme realizes the keyword fuzzy search under encrypted cloud data and saves the cost of time and space greatly at the same time.
【作者单位】: 福州大学数学与计算机科学学院;网络系统信息安全福建省高校重点实验室;福州大学物理与信息工程学院;
【基金】:国家自然科学基金(61402112,61472307,61472309,61303198) 福建省教育厅科技项目(JA12028) 福建省重大科技项目(2015H6013) 福州大学科技发展基金项目(2012-XY-17)资助~~
【分类号】:TP309

【相似文献】

相关期刊论文 前10条

1 梁银;董永权;;基于对象集合的空间关键词查询[J];计算机应用;2014年07期

2 张颖;李昕;;一种关系数据库上的关键词查询排序方法[J];辽宁工业大学学报(自然科学版);2013年05期

3 寇苏玲;蔡庆生;;应用于用户兴趣建模的多文本关键词抽取研究[J];计算机仿真;2007年02期

4 林子雨;杨冬青;王腾蛟;张东站;;基于关系数据库的关键词查询[J];软件学报;2010年10期

5 林子雨;邹权;赖永炫;林琛;;关系数据库中的关键词查询结果动态优化[J];软件学报;2014年03期

6 李益民;;一种大规模Deep Web查询重构技术[J];情报科学;2014年01期

7 李慧颖;瞿裕忠;;基于关键词的RDF数据查询方法[J];东南大学学报(自然科学版);2010年02期

8 杨书新;徐慧琴;;基于数据图的关系数据库关键词查询排序研究[J];计算机应用研究;2014年02期

9 海沫;郭树行;;网络环境中基于语义聚类的多关键词查询机制[J];图书情报工作;2012年20期

10 安镇宙;杨鉴;仇汶;;一种新的基于分层查询表的关键词识别模型[J];计算机工程与应用;2008年02期

相关会议论文 前3条

1 修慧兰;;台湾大学生个人竞争力之相关研究[A];全国教育与心理统计与测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会论文摘要集[C];2008年

2 杨艳;何天宇;;基于短语的关系数据库关键词查询方法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

3 李_,

本文编号:1955718


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1955718.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bb31a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com