基于Lucene的倒排索引性能的研究
本文关键词:基于Lucene的倒排索引性能的研究
【摘要】:倒排索引技术是现代搜索引擎的核心技术之一,索引技术的好坏直接影响搜索引擎的性能。Lucene是一个优秀的全文检索引擎架构,采用高度优化的倒排索引结构,可以方便的嵌入到各种应用程序中。在深入分析和研究Lucene索引机制的基础上,通过实验发现,与传统的字符串匹配查找的性能相比,使用倒排索引的Lucene更快捷、更准确的实现全文检索。
【作者单位】: 贵州交通职业技术学院;
【关键词】: 倒排索引 搜索引擎 Lucene 性能
【分类号】:TP391.3
【正文快照】: 随着互联网的普及以及数字信息的爆炸式增长,网络信息资源数量以几何级数倍增,面对日益产生的海量数据,其异构性、分布性和动态性,对信息检索的研究不断提出新的挑战。为了在海量的数据中迅速而全面地找到所需要的信息,搜索引擎由此产生了。1 Lucene及相关分析1.1 Lucene概述L
【共引文献】
中国期刊全文数据库 前2条
1 魏刃佳;吴振强;;面向教育视频资源的垂直搜索引擎设计与实现[J];计算机工程与应用;2014年15期
2 杜若鹏;赵瑞雪;朱亮;寇远涛;鲜国建;;DSpace的检索机制及其扩展应用[J];图书情报工作;2013年S2期
中国硕士学位论文全文数据库 前5条
1 杨楠;基于用户习惯的网页排序算法研究[D];大连交通大学;2013年
2 张晓伟;聚类算法及在搜索引擎系统中的应用[D];哈尔滨理工大学;2014年
3 王鹏;基于Lucene的中文分词技术研究与实现[D];浙江工商大学;2014年
4 张松峰;政府资助项目个性化推送系统设计与实现[D];首都经济贸易大学;2014年
5 张阳;基于Lucene技术搜索引擎设计与实现[D];吉林大学;2014年
【相似文献】
中国期刊全文数据库 前10条
1 王智强,刘建毅;一种实时更新索引结构的设计与实现[J];计算机系统应用;2005年10期
2 王宏宇;;基于Native-XML数据库倒排索引算法研究[J];情报科学;2006年07期
3 苏潭英;郭宪勇;金鑫;;一种基于Lucene的中文全文检索系统[J];计算机工程;2007年23期
4 黄少林;王华;张玉红;蒋一峰;;基于Lucene的索引系统的设计与实现[J];现代情报;2009年07期
5 王涛;吴洁明;;搜索引擎建立倒排索引的算法研究[J];现代计算机(专业版);2008年01期
6 王路芳;张虎;;一种面向搜索引擎的基于集合模型的搜索算法[J];山西农业大学学报(自然科学版);2009年06期
7 吐尔洪·吾司曼;维尼拉·木沙江;;维、哈、柯多语种搜索引擎中索引器的研究[J];新疆大学学报(自然科学版);2011年02期
8 余淼;杨丹;赵俊芹;;垂直搜索引擎的关键技术研究[J];软件导刊;2007年23期
9 宁可为;;自动答疑系统知识库文本的索引研究[J];电脑知识与技术;2009年35期
10 宁可为;王炜;;基于倒排索引的答疑系统知识库文本研究[J];湖北广播电视大学学报;2010年06期
中国重要会议论文全文数据库 前10条
1 刘小珠;孙莎;曾承;彭智勇;;基于缓存的倒排索引机制研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 董祥千;左志宏;刘强国;;Lucene倒排索引文件的实现与优化[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
4 辛欣;李涓子;;基于Java语言全文信息检索系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
5 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 孙宇;刘憬;张宇;刘挺;;基于分词和倒排索引的短文本检索技术的研究与实现[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
7 李远宁;刘汀;蒋树强;黄庆明;;基于“Bag of Words”的视频匹配方法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
8 李勇;陈文斌;;嵌入式平台上的地址搜索[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
9 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎中查询处理研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 朱虹;吴林;;DM4全文检索机制的设计[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国重要报纸全文数据库 前1条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 冯德瀛;图像检索技术中相似性搜索方法研究[D];上海交通大学;2013年
2 吴炜;密文全文检索系统中的索引机制研究[D];华中科技大学;2009年
3 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年
4 邝砾;基于接口和行为语义的Web服务发现与适配研究[D];浙江大学;2009年
5 温延龙;XML信息检索关键技术研究[D];南开大学;2012年
6 胥正川;基于关系数据库的XML数据存储、更新和检索[D];复旦大学;2003年
7 刘红;近重复视频检测算法研究[D];复旦大学;2012年
8 张帆;搜索引擎中索引表求交和提前停止技术优化研究[D];南开大学;2012年
9 张乃静;基于林业科学数据的语义检索研究[D];中国林业科学研究院;2013年
10 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘红雨;基于倒排索引的微博话题检测[D];哈尔滨工业大学;2013年
2 董长春;基于Hadoop的倒排索引技术的研究[D];辽宁大学;2011年
3 代万能;倒排索引技术在Hadoop平台上的研究与实现[D];电子科技大学;2013年
4 汪红敏;基于固态硬盘的倒排索引动态更新策略及其优化研究[D];华中科技大学;2013年
5 张博;基于Lucene倒排索引性能的研究与优化[D];昆明理工大学;2013年
6 刘晓奎;基于mongodb的倒排索引建立[D];吉林大学;2014年
7 潘胜一;基于倒排索引的压缩算法性能研究[D];杭州电子科技大学;2009年
8 杨国营;基于MapReduce模型文本分类算法的研究[D];辽宁大学;2013年
9 陈雪帆;基于固态硬盘的倒排索引构建与维护策略研究[D];华中科技大学;2012年
10 薛煜阳;农业搜索引擎倒排索引缓冲机制研究[D];新疆农业大学;2011年
,本文编号:1000966
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1000966.html