当前位置:主页 > 科技论文 > 搜索引擎论文 >

分布式搜索引擎中关键词倒排索引方法仿真

发布时间:2021-09-17 09:50
  针对当前信息检索方法存在的检索效率低、检索过程安全性和准确性差的问题,提出分布式搜索引擎中关键词倒排索引方法。以倒排索引理论分析为依据,构建关键词倒排索引体系,并解析索引中的关键技术。使用该技术将多种特征向量构建的超向量当作文档特征提取出来,将取值不同的各维特征向量归一化。提取特征后,将各维特征均值与标准差作为规整向量,完成文档特征规整。依据特征特征规整,利用模糊K均值聚类法生成检索词典。分析词典,构建明文倒排索引文档,对文档中相关记录信息加密,生成密文文档并构建密文文档倒排索引。索引服务器根据CRC32算法处理密文索引词,利用特征提取技术将索引词划分成不同段,根据词典将其转换成字序列用于检索,以命中关键词在每个候选文档中占据的比例当作检索词与全部候选文档相似程度的判定依据,将相似度值按从大到小顺序排列,将排列结果返给用户,完成一次索引。实验结果表明,上述方法检索耗时短、安全系数高,检索结果准确性优于当前方法,适用性强。 

【文章来源】:计算机仿真. 2019,36(08)北大核心

【文章页数】:5 页

【文章目录】:
1 引言
2 分布式搜索引擎中关键词倒排索引方法
    2.1 倒排索引分析
    2.2 关键词倒排索引体系和索引关键技术分析
    2.3 关键词倒排索引与检索
3 实验结果与分析
4 结束语


【参考文献】:
期刊论文
[1]分布式RDF关键词近似搜索方法[J]. 陈远,汪璟玢.  中国科学技术大学学报. 2017(10)
[2]基于.NET的分布式软件体系结构设计与实现[J]. 李岚.  电子设计工程. 2017(16)
[3]海量图书信息快速检索优化管理仿真研究[J]. 李云霞.  计算机仿真. 2017(05)
[4]基于LDA主题模型的分布式信息检索集合选择方法[J]. 何旭峰,陈岭,陈根才,钱坤,吴勇,王敬昌.  中文信息学报. 2017(03)
[5]一种可抵抗统计攻击的安全索引[J]. 惠榛,冯登国,张敏,洪澄.  计算机研究与发展. 2017(02)
[6]基于云计算及大数据技术的电力搜索引擎技术研究[J]. 楼凤丹,裴旭斌,王志强,纪德良.  电网与清洁能源. 2016(12)
[7]基于simhash与倒排索引的复用代码快速溯源方法[J]. 乔延臣,云晓春,庹宇鹏,张永铮.  通信学报. 2016(11)
[8]一种基于指纹因子的鲁棒音频检索方法[J]. 林静,杨继臣,张雪源,李新超.  数据采集与处理. 2016(05)
[9]地理数据空间本体构建及其在数据检索中的应用[J]. 王东旭,诸云强,潘鹏,罗侃,侯志伟.  地球信息科学学报. 2016(04)
[10]ElasticSearch分布式搜索引擎在天文大数据检索中的应用研究[J]. 陈亚杰,王锋,邓辉,刘应波.  天文学报. 2016(02)



本文编号:3398474

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3398474.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e7f5b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com