当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Lucene的企业智能搜索引擎实现的研究.pdf

发布时间:2016-06-24 10:03

  本文关键词:基于Lucene的企业智能搜索引擎实现研究,由笔耕文化传播整理发布。


文档介绍:
I摘要传统互联网搜索引擎可以供用户检索到许多信息,但对于企业用户,它搜索结果涵盖范围太广且不能达成对内部系统报表或数据库的有效查找。再加上现代企业信息化的繁荣兴盛,使得专用的搜索引擎成为他们提高工作效率的迫切需要,企业搜索引擎也因此成为当前科技中备受关注的研究之一。所以论文选定“基于Lucene的企业智能搜索引擎实现研究”这一课题,结合浙江中烟建设搜素引擎系统的目标,引入并改进一系列技术,提出了面向烟草企业的智能搜索引擎架构,并设计实现了浙江中烟搜索引擎系统。本文研究的关键点有:(1)根据浙江中烟智能搜索引擎系统要达到的目标总结出现代企业对搜索引擎的两种需求:一是通过主题搜索为用户提供特定行业的相关信息,如行业动态等;二是根据用户输入的普通查询关键词搜索到相关报表或对内部关系数据库内容。(2)设计特定主题的增量型聚焦网络爬虫:在传统爬虫架构基础上建立烟草主题爬虫架构,改进爬行策略提高爬行速率与准确率,根据烟草行业网站特点制定增量模型提高爬虫的时新性,并将爬取的内容进行云存储、去噪与查重等处理。(3)基于Lucene建立烟草行业的智能检索模型:结合Lucene的向量空间模型算法和改进的PageRank算法给出面向烟草行业相关度排序算法;根据... 内容来自转载请标明出处.


  本文关键词:基于Lucene的企业智能搜索引擎实现研究,,由笔耕文化传播整理发布。



本文编号:60879

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/60879.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户64e90***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com