基于相似查询树的快速密文检索方法
本文关键词:基于相似查询树的快速密文检索方法 出处:《软件学报》2016年06期 论文类型:期刊论文
更多相关文章: 云计算 密文检索 多关键字排序检索 相似查询树 云安全
【摘要】:随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS).该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段,仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.以《软件学报》最近10年的论文作为样本进行了实验,数据集中选取2 900篇文档和4 800个关键词.实验结果显示:当文档集个数呈指数增长时,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强.
[Abstract]:With the wide application of cloud computing, the data volume of data center increases rapidly. At the same time, user documents usually contain privately-sensitive information that needs to be encrypted and then uploaded to a cloud server. The retrieval efficiency of the prior art on the ciphertext data with large amount of data is very low. In this paper, we propose a similar query tree based ciphertext retrieval method based on big data, which clusters the document vectors by setting the maximum distance between the clustering center and the members. The center vector is regarded as the center of the sphere of n-dimensional hypersphere, and the maximum distance is taken as the radius, then the small clustering is gradually aggregated into a large cluster. The collection of ciphertext documents constructed by this method is in the query stage. An ideal set of query results can be obtained only by searching adjacent clustering of query vectors, thus improving the efficiency of ciphertext retrieval. 2 900 documents and 4 800 keywords were selected in the data set. The experimental results show that the retrieval time increases linearly when the number of document sets increases exponentially. And the relevance of retrieval results is stronger than traditional retrieval methods.
【作者单位】: 信息安全国家重点实验室(中国科学院信息工程研究所);广东电网有限责任公司信息中心;
【基金】:广东电网有限责任公司信息中心大数据环境下的数据安全研究项目(K-GD2014-1019) 中国科学院战略性先导科技专项(XDA06040601) 新疆维吾尔自治区科技专项(201230121)~~
【分类号】:TP391.3
【正文快照】: 云计算环境中的数据安全问题越来越多地受到人们关注,为了确保个人数据的隐私性,用户通常先将文档加密,然后再上传到云服务器.然而,数据加密使传统的检索机制失效,随着数据量的增加,如何高效地取回加密存储在云中的数据已成为重要的挑战,密文检索问题已成为近年来信息安全领域
【相似文献】
相关期刊论文 前10条
1 卢中岳;关于工具书的检索方法问题[J];黑龙江图书馆;1980年02期
2 戴勇敢;;对《法律文献检索方法初探》一文的几点意见[J];大学图书馆通讯;1988年01期
3 曹培根;曹炜;;汉语史料检索方法[J];图书馆学研究;1992年02期
4 程文艳;因特网上专利数据库的检索方法[J];信息技术;2001年12期
5 黄玉莲,殷黎;谈美国《数学评论》的编排及检索方法[J];现代情报;2004年06期
6 孙淑萍;;医学文献中信号通路的检索方法及网络信息资源[J];科技情报开发与经济;2013年04期
7 沈建华;因特网科技信息的检索方法和技巧[J];山东电力高等专科学校学报;2001年03期
8 俞凯;吴江琴;;书法字快速多层检索方法[J];计算机辅助设计与图形学学报;2011年08期
9 冯晓辉;数据处理中的检索方法探析[J];辽宁师专学报(自然科学版);2004年01期
10 姜明;王庆文;周恒;;适用于工艺领域的知识检索方法研究[J];新技术新工艺;2011年08期
相关会议论文 前4条
1 郭丽芳;;DIALINDEX数据库收录内容及检索方法[A];2007年中国索引学会年会暨学术研讨会论文集[C];2007年
2 喻宏勇;赵铁军;郑德权;王月颖;;一种面向文件的高效检索方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 陈知困;徐明;黄云森;;一种高效的基于CHMM的哼唱式旋律检索方法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
4 李明;颜永红;;一种基于哼唱的音乐检索方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
相关博士学位论文 前2条
1 袁宝玺;超大规模指纹库的索引结构和检索方法[D];北京邮电大学;2013年
2 金博;面向专利和零部件的设计知识检索方法[D];大连理工大学;2009年
相关硕士学位论文 前10条
1 张颉;基于BIM的建筑空间拓扑关系提取及检索方法研究[D];西安建筑科技大学;2015年
2 刘笑江;基于语义标签组织检索方法的相册应用的设计与实现[D];中山大学;2015年
3 姚彦青;商标检索方法研究与系统实现[D];南京航空航天大学;2010年
4 章金华;电视台台标识别与检索方法研究[D];华中科技大学;2013年
5 梁超;中文类比检索方法研究[D];华东师范大学;2013年
6 李中杰;基于本体的数字邮票检索方法的研究与实现[D];北京邮电大学;2007年
7 周义洪;面向Web的基于哼唱方式的歌曲检索方法与系统实现[D];中南大学;2013年
8 林高全;基于内容的图象检索方法研究[D];西安电子科技大学;2001年
9 蔡思;基于概率的跨媒体检索方法研究[D];华中科技大学;2013年
10 涂春梅;基于语义的成语检索方法研究及试验[D];重庆大学;2009年
,本文编号:1435701
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1435701.html