分布式企业搜索引擎的设计与实现
发布时间:2017-11-07 03:26
本文关键词:分布式企业搜索引擎的设计与实现
更多相关文章: 企业搜索引擎 分布式 solr 图数据库 搜索结果导航
【摘要】:随着互联网的飞速发展,企业内部信息建设的速度也在不断加快,同互联网一样,企业内部信息正日益变得庞杂而难以管理,传统的企业内部信息获取方式已经不能满足当前的需求。通用搜索引擎能够帮助人们快速在互联网中找到自己想要的信息,然而企业信息有其独特之处,照搬通用搜索引擎并不能完全解决问题。总体来说,企业搜索的技术难点有以下几种:企业信息的多源性以及存储结构的多样性、企业搜索覆盖的广度以及精度、定制化搜索以及安全控制等等。本文首先提出了一个分布式的企业搜索引擎框架,然后基于solr分析并且实现了一个分布式企业搜索引擎的原型系统,这个原型系统可以为更加深入全面的实现企业搜索引擎提供一个开端;随后分析了现实中特定类型文档的导航,接着针对企业搜索中一个重要的功能——搜索结果导航进行了分析以及实现。本文的主要工作包括:1、对搜索引擎以及图数据库相关技术进行了研究,深入研究了搜索引擎以及图数据库的核心技术,阐述了分布式企业搜索引擎的总体架构。2、基于开源的全文检索系统solr提比了一个分布式企业搜索引擎框架并且实现了一个分布式的企业搜索引擎的原型系统,定义并且实现了系统的各个功能模块。3、对现实中具有特定类型的文档集的导航进行了详细的分析以及形式化定义,针对这种情况的一个子集——企业内部业务信息的搜索结果导航提出了两种不同的解决方案,对两者进行了实现并且对导航的精度进行了比较,为这种类型的应用实现提供了参考。最后,我们使用文本数据集对系统的检索时间以及检索结果的导航精度进行了验证,实验表明系统达到了预期的设计效果。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【参考文献】
中国期刊全文数据库 前3条
1 黄昌宁;赵海;;中文分词十年回顾[J];中文信息学报;2007年03期
2 文必龙;李添;李娜;高鹏;;企业搜索引擎安全搜索的研究[J];齐齐哈尔大学学报(自然科学版);2010年03期
3 杨建良;王永成;;自动分类技术的发展与展望[J];中国索引;2003年01期
,本文编号:1150634
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1150634.html