大型企业管理系统中实时搜索引擎应用研究
发布时间:2017-04-06 09:16
本文关键词:大型企业管理系统中实时搜索引擎应用研究,由笔耕文化传播整理发布。
【摘要】:信息技术的发展带动了企业信息化的迅猛发展,在大型企业信息管理系统中,信息数量往往非常巨大,且数据的增长、更新速度非常快。而传统的搜索引擎,对于数据检索的实时性及精确性都存在着缺陷。另一方面,企业信息检索系统提供的数据库检索功能在面对海量的企业信息时,它的检索速度会大幅降低,且性能往往满足不了用户的需求,甚至会给数据库的其他正常使用带来影响。针对以上情况,本文构建了基于Lucene的实时检索系统。 本文首先分析了目前企业信息系统中检索系统存在的问题,研究了设计实时检索系统的必要性,进一步研究了搭建实时检索系统所需要的关键技术,包括索引、分词、合并索引段等。此外,就Lucene的主要技术及实现方法进行了研究与探讨,在此基础上,对系统进行了需求分析,探讨、研究了实时检索的构建方法,提出了优化方案,给出了系统的总体解决方案及软件分层设计。 针对普通检索系统中索引处于离线工作的状态,本系统创造性地将索引的建立与查询写入同一进程,并采用多个索引共同工作的方式,保证了文档在添加、删除、更新状态下对应的索引更新的即时性。还在系统中设计增加了搜索系统核心控制模块,它是一个对外的核心类,提供了诸多方法供外界调用。该模块对数据域及查询服务进行统一控制,实现了实时检索。此外,系统采用Servlet和Ajax构建检索交互程序,在本系统的数据结构的基础上,构建了灵活的查询和管理平台。 最后,本文对系统的查询效果进行了测试,并且针对此结果,与基本的Lucene搜索引擎查询进行性能及效果的比较,证明了系统性能明显提高,达到了预期研究目的,满足大数据量及实时性的需求。
【关键词】:实时检索 Lucene 数据库 索引
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
- 摘要4-5
- ABSTRACT5-7
- 目录7-10
- 第一章 绪论10-13
- 1.1 实时搜索的研究背景及意义10
- 1.2 发展现状10-11
- 1.3 本文主要研究内容11-12
- 1.4 论文内容章节安排12-13
- 第二章 相关概念及支撑技术13-28
- 2.1 搜索引擎13-16
- 2.1.1 概念13
- 2.1.2 几种主流的搜索引擎13-15
- 2.1.3 搜索引擎工作原理15-16
- 2.2 Lucene基础知识16-23
- 2.2.1 Lucene简介16
- 2.2.2 基本概念16-18
- 2.2.3 Lucene索引倒排表18-19
- 2.2.4 Lucene总体架构19-20
- 2.2.5 关键技术20-23
- 2.3 数据库23-27
- 2.3.1 概念23
- 2.3.2 发展现状23-25
- 2.3.3 ORALCE关键技术25-27
- 2.4 JAVA设计模式27-28
- 第三章 实时检索系统的需求和设计28-47
- 3.1 系统总体需求设计28-29
- 3.1.1 检索需求28-29
- 3.1.2 索引需求29
- 3.1.3 数据管理需求29
- 3.2 系统的架构设计29-34
- 3.2.1 总体解决方案29-32
- 3.2.2 系统分层设计32-34
- 3.3 搜索引擎34-37
- 3.3.1 Paoding Analyzer分词35-36
- 3.3.2 Merge segment合并索引段36-37
- 3.4 搜索系统核心控制SearchCore37-38
- 3.5 索引设计38-41
- 3.6 数据库41-44
- 3.7 查询44-45
- 3.8 管理45-47
- 3.8.1 优化45-46
- 3.8.2 监视46-47
- 第四章 实时检索系统的实现47-63
- 4.1 系统开发环境47-48
- 4.2 基础架构的搭建48-49
- 4.2.1 准备工作48
- 4.2.2 系统搭建与部署48-49
- 4.2.3 数据库的配置49
- 4.3 建立基本搜索引擎49-52
- 4.3.1 基本部署49-50
- 4.3.2 Paoding Analyzer分词50
- 4.3.3 Merge Segment合并索引段50-52
- 4.4 搜索系统核心控制模块SearchCore的配置52-55
- 4.4.1 SearchCore的基本配置52-54
- 4.4.2 SearchCore的初始化54-55
- 4.5 索引配置55-58
- 4.5.1 内存索引中文档的添加55-56
- 4.5.2 内存索引与硬盘索引的合并56-57
- 4.5.3 索引的删除57-58
- 4.6 数据库58-59
- 4.7 查询59-61
- 4.8 管理61-63
- 4.8.1 优化61
- 4.8.2 监视61-63
- 第五章 系统测试63-66
- 5.1 验证测试63-64
- 5.2 性能测试64-65
- 5.2.1 数据库内容64-65
- 5.2.2 查询时间65
- 5.2.3 索引建立时间65
- 5.3 结论65-66
- 第六章 总结与展望66-68
- 6.1 论文总结66
- 6.2 未来展望66-68
- 参考文献68-69
- 附录 缩略语69-70
- 致谢70
【参考文献】
中国期刊全文数据库 前5条
1 王亚平;;Sybase数据库性能优化研究[J];计算机光盘软件与应用;2012年04期
2 王军庄;常鲜戎;顾卫国;;基于OCL技术的Oracle数据库数据快速存取研究[J];电力系统保护与控制;2009年09期
3 王莉云;王华;陈刚;姚乃明;;基于Lucene的全文检索系统的设计与实现[J];计算机工程与设计;2007年24期
4 张永霞;;关于SQL数据库的分析与探讨[J];数字技术与应用;2011年10期
5 仇雷;;从容应对变化——从一个简单搜索工具架构浅谈Java设计模式[J];科技资讯;2010年13期
本文关键词:大型企业管理系统中实时搜索引擎应用研究,由笔耕文化传播整理发布。
,本文编号:288636
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/288636.html