基于k-mean聚类算法的加密云数据排序搜索仿真
发布时间:2021-01-11 10:04
密钥加密索引向量生成加密数据索引时,会产生数据维度升高问题,导致加密云数据排序搜索时间较长,搜索结果不准确,资源利用率低。为此提出基于k-mean聚类算法的加密云数据排序搜索方法。采用k-mean聚类算法对加密云数据进行预处理,选取质心点,并对数据点进行重新聚类,计算出最新的质心点;根据获取的数据聚类结果,选取文档中具有高代表性的关键词作为文档的索引,同时引入加密搜索插件,对索引向量进行维度缩减,使其在检索时形成和用户检索相关的文档摘要,从而能够发送摘要供用户选择目标文档,得到排序搜索结果,实现加密云数据排序搜索。仿真结果表明,所提方法的搜索结果准确率较高,能够有效提升资源利用率,缩短搜索时间。
【文章来源】:计算机仿真. 2020,37(09)北大核心
【文章页数】:5 页
【部分图文】:
加密搜索模型具体结构图
为了验证所提基于k-mean聚类算法的加密云数据排序搜索方法的综合有效性,需要进行仿真,实验环境为:Windows10操作系统,2.6GHz CPU,8GB内存,NVIDIA Ge Force GTX650。图2为可搜索加密系统模型。根据可搜索加密系统模型,采用本文方法、文献[2]所提云环境下的多用户模糊检索加密方法和文献[3]所提云环境下支持多用户模糊检索加密方法进行对比实验,通过可搜索加密系统模型,在关键词数量不同,文档数量m=5000、文档数量不同,关键词数量n=3000和文档向量分段数量h值不同时,对比三种方法的资源利用率,并在关键词数量相同的情况下,对比三种方法的搜索时间和搜索结果准确率。
以下给出不同情况下不同搜索方法的资源利用率对比结果,具体如图3所示。分析图3(a)可知,当关键词数量不同,文档数量m=5000时,本文方法、云环境下的多用户模糊检索加密方法和云环境下支持多用户模糊检索加密方法的资源利用率随着关键词数量的不断增加而呈上升趋势,本文方法和云环境下的多用户模糊检索加密方法的资源利用率最高,但是本文方法的资源利用率比云环境下的多用户模糊检索加密方法的资源利用率高出2%;分析图3(b)可知,当文档数量不同,关键词数量n=3000时,文档数量在10000个之前,本文方法和云环境下的多用户模糊检索加密方法的资源利用率几乎相同,但是当文档数量从10000开始增加时,云环境下的多用户模糊检索加密方法的资源利用率比本文方法的资源利用率少,上升速度缓慢;分析图3(c)可知,当文档向量分段数量h值不同时,随着文档向量分段数量的不断增长,云环境下的多用户模糊检索加密方法和云环境下支持多用户模糊检索加密方法的资源利用率逐渐降低,而本文方法的资源利用率却呈上升趋势。不管是在何种情况下,本文方法的资源利用率在三种方法中为最高。
【参考文献】:
期刊论文
[1]基于同态加密算法的欧氏距离外包计算协议[J]. 柳玉东,王绪安,高忠石. 计算机工程与应用. 2019(15)
[2]面向高效加密云数据排序搜索的类别分组索引方法[J]. 刘良桂,孙辉,贾会玲,张宇. 电子学报. 2019(02)
[3]排序学习研究进展与展望[J]. 李金忠,刘关俊,闫春钢,蒋昌俊. 自动化学报. 2018(08)
[4]集中式数据库字符型数据加密查询仿真[J]. 王强,魏雨东. 计算机仿真. 2018(07)
[5]基于LeaderRank和节点相似度的复杂网络重要节点排序算法[J]. 顾亦然,朱梓嫣. 电子科技大学学报. 2017(02)
[6]基于Web技术的Dynaform材料数据库的设计与开发[J]. 王景艳,陈明和,王辉,雷晓晶,吴亚凤. 机械工程材料. 2016(10)
[7]云环境下支持多用户模糊检索加密算法研究[J]. 李陶深,王翼,黄汝维. 小型微型计算机系统. 2016(10)
[8]云环境下的多用户模糊检索加密方案[J]. 吴岱霓,王晓明. 计算机工程. 2016(05)
[9]基线与增量数据分离架构下的分布式连接算法[J]. 樊秋实,周敏奇,周傲英. 计算机学报. 2016(10)
[10]企业融资约束与对外直接投资国别区位选择——基于微观数据排序模型的实证研究[J]. 余官胜,都斌. 国际经贸探索. 2016(01)
本文编号:2970572
【文章来源】:计算机仿真. 2020,37(09)北大核心
【文章页数】:5 页
【部分图文】:
加密搜索模型具体结构图
为了验证所提基于k-mean聚类算法的加密云数据排序搜索方法的综合有效性,需要进行仿真,实验环境为:Windows10操作系统,2.6GHz CPU,8GB内存,NVIDIA Ge Force GTX650。图2为可搜索加密系统模型。根据可搜索加密系统模型,采用本文方法、文献[2]所提云环境下的多用户模糊检索加密方法和文献[3]所提云环境下支持多用户模糊检索加密方法进行对比实验,通过可搜索加密系统模型,在关键词数量不同,文档数量m=5000、文档数量不同,关键词数量n=3000和文档向量分段数量h值不同时,对比三种方法的资源利用率,并在关键词数量相同的情况下,对比三种方法的搜索时间和搜索结果准确率。
以下给出不同情况下不同搜索方法的资源利用率对比结果,具体如图3所示。分析图3(a)可知,当关键词数量不同,文档数量m=5000时,本文方法、云环境下的多用户模糊检索加密方法和云环境下支持多用户模糊检索加密方法的资源利用率随着关键词数量的不断增加而呈上升趋势,本文方法和云环境下的多用户模糊检索加密方法的资源利用率最高,但是本文方法的资源利用率比云环境下的多用户模糊检索加密方法的资源利用率高出2%;分析图3(b)可知,当文档数量不同,关键词数量n=3000时,文档数量在10000个之前,本文方法和云环境下的多用户模糊检索加密方法的资源利用率几乎相同,但是当文档数量从10000开始增加时,云环境下的多用户模糊检索加密方法的资源利用率比本文方法的资源利用率少,上升速度缓慢;分析图3(c)可知,当文档向量分段数量h值不同时,随着文档向量分段数量的不断增长,云环境下的多用户模糊检索加密方法和云环境下支持多用户模糊检索加密方法的资源利用率逐渐降低,而本文方法的资源利用率却呈上升趋势。不管是在何种情况下,本文方法的资源利用率在三种方法中为最高。
【参考文献】:
期刊论文
[1]基于同态加密算法的欧氏距离外包计算协议[J]. 柳玉东,王绪安,高忠石. 计算机工程与应用. 2019(15)
[2]面向高效加密云数据排序搜索的类别分组索引方法[J]. 刘良桂,孙辉,贾会玲,张宇. 电子学报. 2019(02)
[3]排序学习研究进展与展望[J]. 李金忠,刘关俊,闫春钢,蒋昌俊. 自动化学报. 2018(08)
[4]集中式数据库字符型数据加密查询仿真[J]. 王强,魏雨东. 计算机仿真. 2018(07)
[5]基于LeaderRank和节点相似度的复杂网络重要节点排序算法[J]. 顾亦然,朱梓嫣. 电子科技大学学报. 2017(02)
[6]基于Web技术的Dynaform材料数据库的设计与开发[J]. 王景艳,陈明和,王辉,雷晓晶,吴亚凤. 机械工程材料. 2016(10)
[7]云环境下支持多用户模糊检索加密算法研究[J]. 李陶深,王翼,黄汝维. 小型微型计算机系统. 2016(10)
[8]云环境下的多用户模糊检索加密方案[J]. 吴岱霓,王晓明. 计算机工程. 2016(05)
[9]基线与增量数据分离架构下的分布式连接算法[J]. 樊秋实,周敏奇,周傲英. 计算机学报. 2016(10)
[10]企业融资约束与对外直接投资国别区位选择——基于微观数据排序模型的实证研究[J]. 余官胜,都斌. 国际经贸探索. 2016(01)
本文编号:2970572
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2970572.html