LUCENE实现基于RSS博客搜索引擎.pdf
发布时间:2016-08-03 19:12
本文关键词:LUCENE实现的基于RSS的博客搜索引擎,由笔耕文化传播整理发布。
文档介绍:
Y143809 1分类号:——U D c:——工学硕士学位论文密级:编号:LUCENE实现的基于RSS的博客搜索引擎硕士研究生指导教师学位级别学科、专业所在单位本论文提交日期本论文答辩日期学位授予单位刘双林俞经善教授工学硕士计算机应用技术计算机科学与技术学院2009年1月7日2009年3月8日l喻尔滨I:程人学哈尔滨下程火学硕十学位论文摘要XML是一种可扩展的标记语言,为跨平台、跨领域的应用提供了一种通信手段。随着XML在WEB应用上的R益广泛,RSS已经成为目前最广泛的XML应用,被广泛的应用于信息服务站点,如新闻网站、博客站点等。随着互联网的迅速发展,搜索引擎成为了人们获取信息的一个重要途径。人们在希望搜索引擎能够提供全面的信息资源的同时,也对搜索引擎的服务提出了更高的要求。与传统的搜索引擎相比,博客搜索引擎在检索内容、工作原理、检索方式等方面有着很大的区别,因此,若用传统的搜索引擎检索一些以RSS格式发布的博客内容,就会存在着检索效率低、更新速度慢等缺点,而RSS博客搜索引擎克服了这些缺点。本文研究了博客搜索引擎的工作原理,主要研究了博客搜索引擎中的博客网络爬虫与用户兴趣模型。网络爬虫是搜索引擎中的一个重要部分,其爬取质量直接影响到搜索引擎的搜索结果。由于...
内容来自转载请标明出处.
本文关键词:LUCENE实现的基于RSS的博客搜索引擎,由笔耕文化传播整理发布。
,本文编号:82523
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/82523.html