当前位置:主页 > 科技论文 > 搜索引擎论文 >

红网门户智能搜索的设计与实现

发布时间:2017-03-26 12:02

  本文关键词:红网门户智能搜索的设计与实现,由笔耕文化传播整理发布。


【摘要】:红网作为重点新闻网站和综合网站,是中国地方新闻网站第一品牌,能够提供新闻资讯发布、视频直播、论坛博客等多种服务,积极打造区域强势网络媒体,成为一个以湖南新闻门户网为旗帜的综合性网络服务平台。根据红网IT支撑系统规范制订建设路线,需要对办公系统、门户、邮件等资源进行统一管理,存在着统计查询困难、系统功能繁多、路径复杂、信息量非常大从而导致用户在操作上存在很大的不便,以及用户经常因为路径不熟悉、口径不熟悉而找不到想要的数据,因此要求提供在新办公系统中实现站内搜索功能。本课题主要采用的关键技术有爬虫技术、中文分词技术、数据挖掘技术、全文检索技术、分布式技术和数据缓存技术等。系统采用Lucene来实现分词、索引、搜索等各个功能,Lucene可以对文本文档进行索引和搜索。本课题研究的红网门户智能搜索很好地帮助红网实现了电子化、精细化、流程化管理,可以将新办公系统、公文系统与门户系统等系统上的资源进行集成管理和站内搜索功能,实现了对公文信息,邮件信息,工单信息以及其它非结构化的数据进行全文检索,同时提供友好的展示形式,帮助系统用户快速定义与查询到数据,提高整个系统的易用性,为用户提高工作效率贡献力量。本文的主要工作是分析了红网门户智能搜索的业务需求,从系统总体功能、功能架构、技术架构、网络拓扑、功能模块等方面进行了总体设计,最后对前端展现功能、爬虫功能、索引功能、检索功能以及系统管理等功能进行了详细设计,最后进行了系统平台搭建和实现,并取得了应用成果,该搜索引擎被红网大量用户正常使用,极大提高了门户网站用户体验。本文的技术创新在于将门户网站网页、红网内部文档等信息资源以标签的形式进行管理,并通过索引方式实现快速定位相关资料。本文还对红网门户智能搜索、人民网、搜狗等中文搜索引擎进行了查全率、查准率与查找速度等指标比较,并得出了相关的结论。通过本课题的研究,红网门户站内搜索引擎能够辅助相关人员更好的、高效的使用门户系统,实现了对红网门户系统中相关文档的快速搜索与定位,实现了对红网门户系统中相关文档的关联性分析与归类。并以友善与简洁的方式对搜索结果进行展示,让使用者便捷地从系统中得到想要的信息,从繁琐的功能点查找中解放出来,有力提升系统应用的效率。总之,系统的开发帮助红网实现快速定位系统内部资源,提高资源查找效率,降低了时间成本。
【关键词】:红网门户 智能搜索 爬虫 索引 分词
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092;TP391.3
【目录】:
  • 摘要5-6
  • Abstract6-13
  • 第1章 绪论13-18
  • 1.1 课题研究的背景与意义13-14
  • 1.2 课题研究的现状14-16
  • 1.3 课题研究的内容16
  • 1.4 课题研究的目的16
  • 1.5 论文的工作与组织结构16-18
  • 第2章 相关开发技术概述18-28
  • 2.1 爬虫技术18-24
  • 2.2 中文分词技术24-25
  • 2.3 数据挖掘技术25
  • 2.4 全文检索技术25
  • 2.5 查询存储技术25-26
  • 2.6 数据同步技术26-27
  • 2.7 本章小结27-28
  • 第3章 系统需求分析28-44
  • 3.1 总体业务需求的分析28-29
  • 3.2 系统业务需求分析29-41
  • 3.2.1 源数据同步29-32
  • 3.2.2 数据处理32-38
  • 3.2.3 前端展现38-40
  • 3.2.4 智能搜索系统管理40-41
  • 3.3 非功能性需求分析41-42
  • 3.3.1 软件需求41
  • 3.3.2 硬件需求41-42
  • 3.4 其他需求分析42-43
  • 3.5 本章小结43-44
  • 第4章 系统总体设计44-51
  • 4.1 系统设计思路44
  • 4.2 系统设计原则44-45
  • 4.3 总体功能框架设计45
  • 4.4 系统功能架构设计45-46
  • 4.5 系统技术架构设计46-47
  • 4.6 系统平台环境设计47-48
  • 4.6.1 硬件环境47-48
  • 4.6.2 软件环境48
  • 4.7 系统网络拓扑设计48-49
  • 4.8 系统模块总体设计49-50
  • 4.9 本章小结50-51
  • 第5章 系统功能详细设计51-59
  • 5.1 前端展现功能的设计51-54
  • 5.2 爬虫功能的设计54-56
  • 5.3 索引功能的设计56
  • 5.4 检索功能的设计56-57
  • 5.5 系统管理功能的设计57-58
  • 5.6 本章小结58-59
  • 第6章 系统的应用效果分析59-64
  • 6.1 系统平台的搭建与实现59-61
  • 6.2 红网门户智能搜索的效果分析61-62
  • 6.3 三种智能搜索引擎的结果对比分析62-63
  • 6.4 本章小结63-64
  • 结论64-66
  • 工作总结64-65
  • 进一步研究展望65-66
  • 参考文献66-69
  • 致谢69

【参考文献】

中国期刊全文数据库 前1条

1 马颖;;浅析法士特企业信息门户系统[J];科技资讯;2011年19期


  本文关键词:红网门户智能搜索的设计与实现,,由笔耕文化传播整理发布。



本文编号:268753

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/268753.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fd8fa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com