检察专线搜索引擎的设计与实现
发布时间:2017-10-25 19:04
本文关键词:检察专线搜索引擎的设计与实现
【摘要】:使用搜索引擎来查找信息已经深入每个互联网用户的心中,估计绝大多数的网民在遇到问题的时候都会打开Google或者百度来寻找答案。随着搜索引擎产业的高速发展,搜索已经像浏览网页、点击网页一样,成为互联网用户最基础的行为模式之一。因此,随着信息量的高速增长,提高搜索引擎技术的性能,协助用户过滤垃圾信息,快速准确的获取信息,在整个互联网领域中有着重要意义。本论文在研究普通搜索的基本原理后,结合通用的搜索引擎技术,并且自身单位的需求,设计并实现了一个高效的检察专线搜索引擎系统。设计完成了检察专线搜索引擎的框架,而且给出了系统主要部分的实现。根据以上需求分析,结合搜索引擎系统的基本架构,设计的专线搜索引擎系统将分为数据采集子系统、索引子系统、检索子系统和检察专业词库四个模块.检察专线搜索引擎主要服务于检察专线网,以搜索各个检察院内部信息发布系统为主提供信息检索查询服务。和通用搜索引擎检索速度快、查全率高和查准率高的目标相比,还需要满足更多的功能需求,主要研究内容如下:1、利用LNMPP技术构架的特点,特别为系统优化配置提供了良好的高性能高负载性。2、检察专线网内信息更新频率较快,对需要索引数据库进行快捷方便的增量更新,以保证用户检索的信息是最新的。3、对抓取资源信息进行法律相关专业词汇的分析和处理,形成适合内部使用的检察专业词库。4、参照结合了sphinx,sphider的构架,结合了面向对象语言设计思维,给出了检察专线搜索系统核心模块框架,详细的阐述了检察专线搜索引擎的数据抓取,数据索引,数据查询的设计,给出了详细的设计与具体的实现。5、重点介绍了检察专线搜索引擎的设计思想与框架的设计,综合的分析了检察专线搜索系统的实现。
【关键词】:搜索引擎 索引 检索
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 绪论10-16
- 1.1 研究课题的学术背景10
- 1.2 国内外关于该论题的研究现状和发展趋势10-12
- 1.2.1 国外的研究现状和发展趋势10-12
- 1.2.2 国内的研究现状和发展趋势12
- 1.3 检察机关信息化建设现状分析12-13
- 1.4 研究本课题的意义13-14
- 1.5 本文主要研究工作14-15
- 1.6 本论文的结构安排15-16
- 第二章 搜索引擎相关技术16-23
- 2.1 搜索引擎的工作原理16-18
- 2.2 数据索引技术18-19
- 2.3 SPHINX全文数据检索工具介绍19-20
- 2.4 分词技术20-21
- 2.5 流行中文分词工具21-22
- 2.6 本章小结22-23
- 第三章 检察专线搜索引擎的设计23-36
- 3.1 检察专线搜索引擎系统本地调研23-25
- 3.1.1 人员调研23-24
- 3.1.2 网络环境调研24-25
- 3.2 专线搜索引擎的功能需求分析25-26
- 3.2.1 检察专线搜索引擎的需求分析25
- 3.2.2 检察专线搜索引擎的可行性分析25-26
- 3.3 检察专线搜索引擎的整体设计26-27
- 3.4 数据采集子系统27-29
- 3.5 索引子系统29-30
- 3.6 检索子系统模块30-32
- 3.7 检察专业搜索词库32-33
- 3.8 检察专线搜索引擎系统数据库表设计33-35
- 3.9 本章小结35-36
- 第四章 检察专线搜索引擎系统的实现36-59
- 4.1 系统开发环境概述36
- 4.2 数据采集接.子系统的实现36-42
- 4.2.1 数据采集接.子系统主要算法描述36-42
- 4.2.2 核心算法和难点问题42
- 4.3 索引子系统的实现42-45
- 4.3.1 基本功能概述42-43
- 4.3.2 索引器的数据结构43-44
- 4.3.3 核心算法和难点44-45
- 4.4 检索模块的实现45-48
- 4.5 检察专线系统中文分词的实现48-50
- 4.6 检察专线系统词库的实现50-53
- 4.7 多线程搜索的实现53-55
- 4.8 用户界面及其实现算法55-58
- 4.9 本章小结58-59
- 第五章 检察专线搜索引擎的测试与分析59-67
- 5.1 检察专线搜索引擎系统性能测试59-61
- 5.2 单线程网页抓取性能测试61-63
- 5.3 对内网搜索引擎边际安全测试63-65
- 5.4 本章小结65-67
- 第六章 结论与展望67-68
- 6.1 论文工作总结67
- 6.2 系统展望67-68
- 致谢68-69
- 参考文献69-71
【参考文献】
中国硕士学位论文全文数据库 前1条
1 张伟;垂直搜索引擎设计与实现[D];西安电子科技大学;2008年
,本文编号:1095067
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1095067.html