基于自动分词的企业文档搜索引擎设计与实现.pdf 全文免费在线阅读
发布时间:2016-11-22 17:05
本文关键词:基于自动分词的企业文档搜索引擎设计与实现,由笔耕文化传播整理发布。
文档介绍:
西北工业大学硕士学位论文基于自动分词的企业文档搜索引擎设计与实现姓名:陈海波申请学位级别:硕士专业:控制科学与工程指导教师:张新家20070301摘要随着计算机和网络的普及,越来越多的企业利用计算机对文档进行处理,在企业的运营过程中必然会产生大量的电子文档。如何在大量的电子文档中迅速而准确的检索出用户所需要的信息成为摆在人们面前的一大难题,为了解决这一问题本文设计了一个应用于企业文档检索的中英文文档搜索引擎系统。搜索引擎的设计涉及到中文分词、数据收集、索引组织、检索结果排序、用户行为分析等关键技术。从功能上看,搜索引擎主要由信息采集、索引、查询三部分构成。搜索引擎首先通过信息采集器采集文档数据,然后通过索引器对采集数据进行分析,并建立索引。检索器负责接受用户查询请求,通过索引找到所有相关文档,排序后返回给用户。首先,本文对中文搜索引擎的基础技术一中文分词技术进行了介绍,并对中文自动分词的实现方法进行了深入的研究。综合各种分词方法,实现了一种适用于企业文档检索的中文自动分词系统;同时本文对搜索引擎的关键技术:索引技术和检索模型进行了深入探讨,提出了一种可用于数据库存储的双向索引结构,有效降低了索引组织的复杂度,通过...
内容来自转载请标明出处.
本文关键词:基于自动分词的企业文档搜索引擎设计与实现,由笔耕文化传播整理发布。
,本文编号:186261
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/186261.html