一种基于Lucene的高效索引建立方法
发布时间:2021-03-07 13:35
随着计算机技术和互联网技术的发展,人们也越来越多的使用电子文档记录数据,电子文档具有容量大,易存储和易转移等特点,但当数据量较大时查找电子文档的内容就需要借助索引技术加快搜索速度,索引技术的优劣直接影响用户的使用体验。主要探讨单机存储大规模文档时高效索引的建立问题,论文分析检索系统的组成和原理,最后使用Lucene工具包通过多线程建立多个索引目录的方式,加速索引的建立以及索引查询的速度。实验结果表明,该文的方法能有效提升索引的创建和搜索速度。
【文章来源】:工业控制计算机. 2020,33(01)
【文章页数】:2 页
【部分图文】:
Lucene索引创建及搜索
论文实验采用Java语言,针对100M、200M至1G的文本集,分别使用单线程程序和本文提出的多线程多索引目录的方法创建索引并检索关键字,比较创建索引的速度和检索关键字的速度。实验结果如图2所示。通过实验结果可以看出,在创建索引阶段,本文的方法可以明显提高索引的创建速度,并且数据集越大速度提升越明显。在索引检索阶段,当索引数据量较小时单线程有优势,但是当索引数据量增大时,多线程的检索效率更高。这是由于索引数据量较小时,多线程需要额外的线程创建和切换时间,导致整个过程耗时更多。
【参考文献】:
期刊论文
[1]基于搜索引擎日志的用户查询意图分类[J]. 杨杰,徐越,余建桥,蒋建华. 指挥信息系统与技术. 2019(02)
[2]基于SSM框架的高并发电子商务平台设计与实现[J]. 吴倩,应捷,韩旭. 电子商务. 2019(03)
[3]Hash表与B+树相结合的高效目录索引结构[J]. 刘贤焯,王劲林,朱明,邓峰,孙鹏. 西安交通大学学报. 2013(04)
[4]关于Lucene索引工具的性能优化研究[J]. 张春燕,刘发升. 计算机技术与发展. 2011(05)
[5]Lucene的全文检索的研究与应用[J]. 李永春,丁华福. 计算机技术与发展. 2010(02)
[6]基于Lucene的索引系统的设计与实现[J]. 黄少林,王华,张玉红,蒋一峰. 现代情报. 2009(07)
[7]一种高效的全文检索索引技术[J]. 陈玮,陈玉鹏,石晶,陆达. 计算机应用研究. 2004(07)
硕士论文
[1]基于Lucene的全文检索系统的设计与实现[D]. 范蕾.厦门大学 2014
本文编号:3069194
【文章来源】:工业控制计算机. 2020,33(01)
【文章页数】:2 页
【部分图文】:
Lucene索引创建及搜索
论文实验采用Java语言,针对100M、200M至1G的文本集,分别使用单线程程序和本文提出的多线程多索引目录的方法创建索引并检索关键字,比较创建索引的速度和检索关键字的速度。实验结果如图2所示。通过实验结果可以看出,在创建索引阶段,本文的方法可以明显提高索引的创建速度,并且数据集越大速度提升越明显。在索引检索阶段,当索引数据量较小时单线程有优势,但是当索引数据量增大时,多线程的检索效率更高。这是由于索引数据量较小时,多线程需要额外的线程创建和切换时间,导致整个过程耗时更多。
【参考文献】:
期刊论文
[1]基于搜索引擎日志的用户查询意图分类[J]. 杨杰,徐越,余建桥,蒋建华. 指挥信息系统与技术. 2019(02)
[2]基于SSM框架的高并发电子商务平台设计与实现[J]. 吴倩,应捷,韩旭. 电子商务. 2019(03)
[3]Hash表与B+树相结合的高效目录索引结构[J]. 刘贤焯,王劲林,朱明,邓峰,孙鹏. 西安交通大学学报. 2013(04)
[4]关于Lucene索引工具的性能优化研究[J]. 张春燕,刘发升. 计算机技术与发展. 2011(05)
[5]Lucene的全文检索的研究与应用[J]. 李永春,丁华福. 计算机技术与发展. 2010(02)
[6]基于Lucene的索引系统的设计与实现[J]. 黄少林,王华,张玉红,蒋一峰. 现代情报. 2009(07)
[7]一种高效的全文检索索引技术[J]. 陈玮,陈玉鹏,石晶,陆达. 计算机应用研究. 2004(07)
硕士论文
[1]基于Lucene的全文检索系统的设计与实现[D]. 范蕾.厦门大学 2014
本文编号:3069194
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3069194.html