基于Solr的企业搜索引擎研究与实现
发布时间:2018-03-23 19:33
本文选题:企业搜索引擎 切入点:Solr 出处:《中国地质大学(北京)》2017年硕士论文
【摘要】:企业搜索引擎是指通过程序或人工的方式,对企业中的信息进行采集,之后对采集的信息数据进行提取、处理和整理,然后向企业员工提供企业信息搜索服务的应用系统。如今,企业发展的速度越来越快,企业中的信息量迅速增加,并且企业中的信息多种多样,既有存储在数据库中结构化数据,也有附载在文本、视频等文件中的非结构化信息。而且这些信息的存储比较分散,这给企业信息的查询带来了极大的困难。目前,一些国外的公司已经推出了比较成熟的企业搜索引擎,但是在国内,企业搜索引擎还处于课题研究阶段,并没有相关的产品。因此,迫切需要构建一个企业搜索引擎,能够让企业员工方便、快速的查找信息。在上述背景下,本文经某企业委托构建一个企业搜索引擎,帮助企业员工方便、快速地查询信息,从而提升企业员工的办公效率和办公质量。通过对传统搜索引擎的研究分析,本文认为在全文搜索引擎、目录索引搜索引擎和元搜索引擎中,全文搜索引擎的构建思路和提供服务的方式更符合企业搜索引擎的需求。Solr是目前比较流行的、用于构建全文搜索引擎的先进技术,它提供了灵活的、简单的接口,让开发人员能够方便、快速地构建搜索引擎,所以本文将使用Solr作为构建企业搜索引擎的技术支持,以降低开发成本。在本文的企业搜索引擎建设中,数据采集、数据索引和数据搜索三部分是其核心,同时,也是其构建的难点所在。在数据采集中,本文通过同时使用配置数据源的方式来完成结构化数据的采集。企业中还有大量的非结构化数据存储在文档、视频等文件中,为了更好的采集这些数据,本文使用文件管理系统将其转化为结构化数据,再进行数据的采集。在数据索引中,本文通过分析企业信息管理系统中的数据结构,使用用于标识数据更新日期的字段,来实现数据的增量索引,大大提高了数据索引的速度。最后,本文对企业搜索引擎提供的搜索服务进行设计与实现,具体包括关键词搜索、范围搜索以及高级搜索,并对基于角色的权限模型进行了扩展,引入了部门和用户组的概念,加强了企业数据的安全性。
[Abstract]:Enterprise search engine refers to the program or artificial way to collect the information in the enterprise, the information extraction of the data acquisition, processing and finishing, and then application system to the enterprise staff to provide enterprise information search service. Today, enterprise development faster and faster, the amount of information in enterprises increased rapidly. And the enterprise information varied, both structured data in a database, are contained in the text, video and other unstructured information in the file. And these information scattered, it brings great difficulties to the enterprise information query. At present, some foreign companies have launched a mature enterprise search engine, but in China, the enterprise search engine is still in the research stage, and no related products. Therefore, it is urgent to establish a business search engine, can make Employees convenient, quick search of information. Based on the above background, this article through an enterprise commissioned to construct an enterprise search engine, help employees to convenient, fast query information, so as to enhance the enterprise staff's office efficiency and the work quality. Through the research of the traditional search engine analysis, this paper thinks that the search engine in the directory the index search engine and meta search engine, search engine construction and service modes of enterprises more in line with the needs of the search engine.Solr is popular, for the construction of full text search engine advanced technology, it provides a flexible, simple interface, convenient for developers to quickly build a search. This article will use the Solr engine, so as to support the construction of enterprise search engine technology, in order to reduce the cost of development. In this paper the enterprise search engine construction, data acquisition, Data index and search data the three part is the core, at the same time, the difficulty of construction. In the data collection, this paper completed structured data acquisition by simultaneously using the configuration data source. The enterprise and unstructured data storage in a large number of documents, video and other documents, in order to collect these data in this paper, using the file management system will be transformed into structured data, then the data acquisition data. In the index, this paper analyzes the data structure of the enterprise information management system in the field, used for updated identification data, to realize the increment of index data, greatly improving the speed of data index. Finally, to the enterprise the design and implementation of search service in this paper, including keyword search, search and advanced search, and the permission model based on color angle The concept of department and user group is introduced, and the security of enterprise data is strengthened.
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
相关期刊论文 前2条
1 ;高效的企业级搜索引擎Solr[J];中国教育网络;2010年10期
2 赵凯;王敏;;基于Solr的企业级搜索引擎的设计[J];电子世界;2013年22期
相关硕士学位论文 前8条
1 刘博文;分布式企业搜索引擎的设计与实现[D];浙江大学;2015年
2 任乐乐;基于Solr的分布式搜索引擎研究[D];中国计量大学;2016年
3 赵亮;基于Solr的企业搜索引擎研究与实现[D];中国地质大学(北京);2017年
4 王小森;基于Solr的搜索引擎的设计与实现[D];北京邮电大学;2011年
5 李雪利;基于Solr的企业搜索引擎的研究与实现[D];浙江理工大学;2013年
6 蔡学锋;基于Solr的搜索引擎核心技术研究与应用[D];武汉理工大学;2013年
7 李晨鸣;基于solr搜索引擎的问吧系统的设计与实现[D];电子科技大学;2012年
8 张新生;基于solr的分布式搜索引擎研究[D];华中科技大学;2012年
,本文编号:1654869
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1654869.html