当前位置:主页 > 科技论文 > 搜索引擎论文 >

检察专线搜索引擎的设计与实现

发布时间:2017-10-25 19:04

  本文关键词:检察专线搜索引擎的设计与实现


  更多相关文章: 搜索引擎 索引 检索


【摘要】:使用搜索引擎来查找信息已经深入每个互联网用户的心中,估计绝大多数的网民在遇到问题的时候都会打开Google或者百度来寻找答案。随着搜索引擎产业的高速发展,搜索已经像浏览网页、点击网页一样,成为互联网用户最基础的行为模式之一。因此,随着信息量的高速增长,提高搜索引擎技术的性能,协助用户过滤垃圾信息,快速准确的获取信息,在整个互联网领域中有着重要意义。本论文在研究普通搜索的基本原理后,结合通用的搜索引擎技术,并且自身单位的需求,设计并实现了一个高效的检察专线搜索引擎系统。设计完成了检察专线搜索引擎的框架,而且给出了系统主要部分的实现。根据以上需求分析,结合搜索引擎系统的基本架构,设计的专线搜索引擎系统将分为数据采集子系统、索引子系统、检索子系统和检察专业词库四个模块.检察专线搜索引擎主要服务于检察专线网,以搜索各个检察院内部信息发布系统为主提供信息检索查询服务。和通用搜索引擎检索速度快、查全率高和查准率高的目标相比,还需要满足更多的功能需求,主要研究内容如下:1、利用LNMPP技术构架的特点,特别为系统优化配置提供了良好的高性能高负载性。2、检察专线网内信息更新频率较快,对需要索引数据库进行快捷方便的增量更新,以保证用户检索的信息是最新的。3、对抓取资源信息进行法律相关专业词汇的分析和处理,形成适合内部使用的检察专业词库。4、参照结合了sphinx,sphider的构架,结合了面向对象语言设计思维,给出了检察专线搜索系统核心模块框架,详细的阐述了检察专线搜索引擎的数据抓取,数据索引,数据查询的设计,给出了详细的设计与具体的实现。5、重点介绍了检察专线搜索引擎的设计思想与框架的设计,综合的分析了检察专线搜索系统的实现。
【关键词】:搜索引擎 索引 检索
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第一章 绪论10-16
  • 1.1 研究课题的学术背景10
  • 1.2 国内外关于该论题的研究现状和发展趋势10-12
  • 1.2.1 国外的研究现状和发展趋势10-12
  • 1.2.2 国内的研究现状和发展趋势12
  • 1.3 检察机关信息化建设现状分析12-13
  • 1.4 研究本课题的意义13-14
  • 1.5 本文主要研究工作14-15
  • 1.6 本论文的结构安排15-16
  • 第二章 搜索引擎相关技术16-23
  • 2.1 搜索引擎的工作原理16-18
  • 2.2 数据索引技术18-19
  • 2.3 SPHINX全文数据检索工具介绍19-20
  • 2.4 分词技术20-21
  • 2.5 流行中文分词工具21-22
  • 2.6 本章小结22-23
  • 第三章 检察专线搜索引擎的设计23-36
  • 3.1 检察专线搜索引擎系统本地调研23-25
  • 3.1.1 人员调研23-24
  • 3.1.2 网络环境调研24-25
  • 3.2 专线搜索引擎的功能需求分析25-26
  • 3.2.1 检察专线搜索引擎的需求分析25
  • 3.2.2 检察专线搜索引擎的可行性分析25-26
  • 3.3 检察专线搜索引擎的整体设计26-27
  • 3.4 数据采集子系统27-29
  • 3.5 索引子系统29-30
  • 3.6 检索子系统模块30-32
  • 3.7 检察专业搜索词库32-33
  • 3.8 检察专线搜索引擎系统数据库表设计33-35
  • 3.9 本章小结35-36
  • 第四章 检察专线搜索引擎系统的实现36-59
  • 4.1 系统开发环境概述36
  • 4.2 数据采集接.子系统的实现36-42
  • 4.2.1 数据采集接.子系统主要算法描述36-42
  • 4.2.2 核心算法和难点问题42
  • 4.3 索引子系统的实现42-45
  • 4.3.1 基本功能概述42-43
  • 4.3.2 索引器的数据结构43-44
  • 4.3.3 核心算法和难点44-45
  • 4.4 检索模块的实现45-48
  • 4.5 检察专线系统中文分词的实现48-50
  • 4.6 检察专线系统词库的实现50-53
  • 4.7 多线程搜索的实现53-55
  • 4.8 用户界面及其实现算法55-58
  • 4.9 本章小结58-59
  • 第五章 检察专线搜索引擎的测试与分析59-67
  • 5.1 检察专线搜索引擎系统性能测试59-61
  • 5.2 单线程网页抓取性能测试61-63
  • 5.3 对内网搜索引擎边际安全测试63-65
  • 5.4 本章小结65-67
  • 第六章 结论与展望67-68
  • 6.1 论文工作总结67
  • 6.2 系统展望67-68
  • 致谢68-69
  • 参考文献69-71

【参考文献】

中国硕士学位论文全文数据库 前1条

1 张伟;垂直搜索引擎设计与实现[D];西安电子科技大学;2008年



本文编号:1095067

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1095067.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5b4fc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com