基于Lucene的索引文件深入研究
本文关键词:基于Lucene的索引文件深入研究
【摘要】:索引是搜索引擎的核心概念,优化索引提高使用效率是当前主要研究内容。文中研究了Lucene索引文件的内部结构,包括Lucene索引文件格式、文件组成、索引创建过程,并重点研究了段Segment文件的存储结构。经研究表明,创建单一且重用的文档实例以及提高使用的内存大小可有效提高索引使用效率。
【作者单位】: 江苏联合职业技术学院徐州财经分院;
【分类号】:TP391.3
【正文快照】: 1引言(Introduction)在Lucence中包括了几个基础的概念,分别是索引、段、文档、域和项。其中索引由段构成,段由文档构成,因此索引可以理解为包含了多个文档的序列。文档由域构成,域由项构成,项是索引中最小构成单位,其本质是一个字符串。段是索引数据存储的基本单元,多个段之
【参考文献】
中国期刊全文数据库 前4条
1 王冬;左万利;赫枫龄;彭涛;张长利;;一种增量倒排索引结构的设计与实现[J];吉林大学学报(理学版);2007年06期
2 李晓丽;杜振龙;;基于Lucence的个性化搜索引擎研究[J];计算机工程;2010年19期
3 黄轶文;;搜索引擎原理与快速开发应用[J];科技信息;2010年36期
4 何伟;薛素静;孔梦荣;杨正党;;基于Lucene的全文搜索引擎的设计与实现[J];情报杂志;2006年09期
【共引文献】
中国期刊全文数据库 前10条
1 周珍娟;张字平;陆玲;;基于Lucene2.0的电子文献全文检索系统[J];电脑知识与技术(学术交流);2007年23期
2 吴佩韦;李昌华;;一种基于Lucene的搜索推荐词生成方法[J];电脑知识与技术;2009年10期
3 李文;洪亲;滕忠坚;石兆英;;一种由B+树实现的倒排索引[J];电脑知识与技术;2011年08期
4 李明宙;罗艳;王宗义;;Lucene全文检索引擎的结构机制与应用方式[J];广西科学院学报;2010年04期
5 王文超;亢焕楠;;基于安卓系统的桌面搜索引擎的设计研究[J];电子技术与软件工程;2014年16期
6 胡宏伟;虞萍;周南;乔军;;基于Lucene的文献资料全文检索系统的设计与实现[J];重庆理工大学学报(自然科学);2014年11期
7 吴代文;;Lucene文本分析器的改进[J];信息技术;2011年10期
8 孙虞禄;万e,
本文编号:1246982
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1246982.html