面向博客领域垂直搜索引擎地研究及实现论文.pdf 全文免费在线阅读
发布时间:2016-10-23 18:42
本文关键词:面向博客领域的垂直搜索引擎的研究与实现,由笔耕文化传播整理发布。
文档介绍:
面向博客领域的垂直搜索引擎的研究与实现摘要随着网络信息资源呈几何级数增长,使用传统搜索引擎技术准确、快速地查找所需信息也变得越来越困难。面对每天海量递增的数据量,通用搜索引擎(又称为水平搜索引擎)很难及时地更新索引数据库;面对数以亿计的网页通用搜索引擎很难深入抓取信息。针对通用搜索引擎存在搜索不够快速、不够深入的缺点,新一代搜索技术一垂直搜索引擎应运而生。垂直搜索是针对某~个行业的专业搜索引擎,是搜索引擎的细分和延伸,是相对通用搜索引擎的信息量大、查询不准确、深度不够等问题提出来的新一代搜索引擎服务模式。通过针对某一特定领域、某一特定人群或某一特定需求提供有一定价值的信息和相关服务。与通用搜索引擎的信息采集技术不同,垂直搜索引擎的网络蜘蛛(又称为网络爬虫)仅采集与主题相关的信息。通过对网页的主题相关度进行预测和判断,专业网络蜘蛛在爬行时避开了大量主题无关的区域。由于只采集主题相关的网页,垂直搜索引擎在查询的准确率和效率上都有显著地提高。本文首先介绍了垂直搜索引擎技术的研究现状和发展方向,然后重点研究了垂直搜索引擎的主题搜索策略和主题相关度判别算法;在分析了、阐述了通用搜索引擎与垂直搜索引擎在系统架构、...
内容来自转载请标明出处.
本文关键词:面向博客领域的垂直搜索引擎的研究与实现,,由笔耕文化传播整理发布。
本文编号:150947
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/150947.html