当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Lucene.NET的网络信息搜索系统的设计与实现

发布时间:2017-04-20 08:18

  本文关键词:基于Lucene.NET的网络信息搜索系统的设计与实现,由笔耕文化传播整理发布。


【摘要】:自从进入二十一世纪以来,随着信息化技术以及互联网技术的不断发展和创新。人类生活的各个方面越来越需要互联网上的各种信息和数据。因此在互联网上的数据和信息也在迅速的膨胀。由于互联网数据信息的广泛性,人们必须要通过某种手段对自身需要的数据信息进行筛选和选择。 互联网数据信息有着很重要的利用价值,但是在海量的数据信息中对用户所需要的数据信息进行检索和筛选是当今互联网技术领域以及信息检索技术领域的一个热门话题。利用Lucene技术开发的网络信息搜索技术是当今互联网数据信息检索技术的热点。几乎成为了全文搜索的同义词。伴随着.NET开发平台不断地完善和发展,作为Lucene在.NET开发平台的移植版本,Lucene.NET也越来越流行。互联网数据信息的搜索主要在数据的挖掘和查找,多种数据信息的检索,良好的用户体验,优良的自然语言查询以及本土化查询等方面加强发展。数据挖掘技术主要应用在分布式数据库中,互联网中的数据信息与数据挖掘技术以及数据的检索技术相结合,,可以给用户提供一个新的数据信息学习模式以及解决问题的方式方法。 将Lucene.NET,C#开发语言以及数据库相关的技术与理论应用于互联网的数据信息资源搜索的过程之中,形成一个功能完善运行稳定的网络信息搜索系统,这样就能大大提高对互联网数据资源利用的效率以及准确性,并且也尽可能的避免了数据统计的错误,从而达到高效智能化利用互联网数据信息资源的目的。 本文的主要内容如下: 1.简要介绍了本文的研究背景,研究现状以及研究内容和意义; 2.主要介绍了互联网搜索引擎系统的产生背景,发展阶段以及分类特点,并介绍了其应用在实际处理中的优点; 3.描述了Lucene.NET以及网络爬虫相关技术的特点以及理论知识,并根据其理论设计出网络信息搜索系统的相关逻辑以及规则; 4.网络信息搜索系统的实现部分。从系统软件结构,主要功能,数据库设计以及具体实现界面的角度全面介绍了该系统的实现步骤以及具体功能。 5.对网络信息搜索系统的功能模块进行了测试,并根据测试结果发现该系统的不足并加以改进。
【关键词】:互联网数据信息 Lucene.NET 搜索引擎 网络爬虫技术
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要4-6
  • Abstract6-10
  • 第1章 绪论10-13
  • 1.1 研究背景10
  • 1.2 研究现状10-11
  • 1.3 发展趋势11
  • 1.4 研究内容及意义11-12
  • 1.5 本文主要结构12-13
  • 第2章 基于 LUCENE.NET 网络信息搜索系统概述13-19
  • 2.1 LUCENE.NET 原理13-14
  • 2.2 搜索引擎介绍14
  • 2.3 搜索引擎的分类14-15
  • 2.4 基于 LUCENE.NET 实现网络信息搜索15-18
  • 2.4.1 创建和管理索引库16-17
  • 2.4.2 查找索引库17-18
  • 2.4.3 索引的优化和合并18
  • 2.5 本章小结18-19
  • 第3章 网络信息搜索系统关键技术19-31
  • 3.1 网络爬虫技术19-23
  • 3.1.1 网络爬虫技术的发展历程19-20
  • 3.1.2 网络爬虫技术的抓取原理20
  • 3.1.3 网络爬虫的架构20-22
  • 3.1.4 网络爬虫的连接池和日志22-23
  • 3.2 自然语言处理23-29
  • 3.2.1 文档重排技术24-25
  • 3.2.2 中文关键词提取25-26
  • 3.2.3 文本摘要26-27
  • 3.2.4 文本信息提取27-28
  • 3.2.5 中文分词28-29
  • 3.3 本章小结29-31
  • 第4章 系统的设计与实现31-42
  • 4.1 系统需求分析31
  • 4.2 系统设计目标31-32
  • 4.3 系统主要功能32-33
  • 4.4 系统数据库分析33-34
  • 4.5 功能模块设计34-39
  • 4.5.1 爬虫功能模块设计34-37
  • 4.5.2 更新功能模块设计37-39
  • 4.5.3 文档处理功能模块设计39
  • 4.6 系统的实现39-41
  • 4.7 本章小结41-42
  • 第5章 网络信息搜索系统测试42-45
  • 5.1 系统测试环境42
  • 5.2 测试用例42-43
  • 5.3 本章小结43-45
  • 第6章 总结与展望45-47
  • 6.1 总结45
  • 6.2 展望45-47
  • 参考文献47-49
  • 致谢49

【参考文献】

中国期刊全文数据库 前2条

1 张晓刚,李明树;智能搜索引擎技术的研究与发展[J];计算机工程与应用;2001年24期

2 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期


  本文关键词:基于Lucene.NET的网络信息搜索系统的设计与实现,由笔耕文化传播整理发布。



本文编号:318267

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/318267.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ec30***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com