面向博客领域垂直搜索引擎与研究实现.pdf
本文关键词:面向博客领域的垂直搜索引擎的研究与实现,由笔耕文化传播整理发布。
北京邮电大学 硕士学位论文
面向博客领域的垂直搜索引擎的研究与实现 姓名:王嘉杰 申请学位级别:硕士 专业:软件工程 指导教师:金跃辉;赵方 座机电话号码 面向博客领域的垂直搜索引擎的研究与实现 摘要 随着网络信息资源呈几何级数增长,使用传统搜索引擎技术准 确、快速地查找所需信息也变得越来越困难。面对每天海量递增的数 据量,通用搜索引擎 又称为水平搜索引擎 很难及时地更新索引数 据库;面对数以亿计的网页通用搜索引擎很难深入抓取信息。针对通 用搜索引擎存在搜索不够快速、不够深入的缺点,新一代搜索技术一 垂直搜索引擎应运而生。 垂直搜索是针对某~个行业的专业搜索引擎,是搜索引擎的细分
和延伸,是相对通用搜索引擎的信息量大、查询不准确、深度不够等 问题提出来的新一代搜索引擎服务模式。通过针对某一特定领域、某
一特定人群或某一特定需求提供有一定价值的信息和相关服务。 与通用搜索引擎的信息采集技术不同,垂直搜索引擎的网络蜘蛛 又称为网络爬虫 仅采集与主题相关的信息。通过对网页的主题相
关度进行预测和判断,专业网络蜘蛛在爬行时避开了大量主题无关的 区域。由于只采集主题相关的网页,垂直搜索引擎在查询的准确率和
效率上都有显著地提高。 本文首先介绍了垂直搜索引擎技术的研究现状和发展方向,然后
重点研究了垂直搜索引擎的主题搜索策略和主题相关度判别算法;在
分析了、阐述了通用搜索引擎与垂直搜索引擎在系统架构、工作原理、
关键技术等方面的不同特点基础上,对博客垂直搜索引擎核心模块一
索引及检索模块进行设计;并对博客垂直搜索引擎系统的具体实现和
实施做了详细地描
本文关键词:面向博客领域的垂直搜索引擎的研究与实现,,由笔耕文化传播整理发布。
本文编号:150945
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/150945.html