面向丝绸领域的垂直搜索引擎关键算法研究.doc 全文免费在线阅读
发布时间:2016-11-02 15:31
本文关键词:面向丝绸领域的垂直搜索引擎关键算法研究,由笔耕文化传播整理发布。
文档介绍:
面向丝绸领域的垂直搜索引擎关键算法研究摘要―I―摘要垂直搜索引擎是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后以某种形式返回给用户。垂直搜索引擎与传统的网页搜索引擎最大的区别就是将网页中的信息进行结构化的抽取。使得信息在抽取的时候就建立了分类,更好的适应查询需求。近几年来,垂直搜索引擎已经被应用到某些专业的领域(如化学、科技文献)。本文从研究和设计的角度对垂直搜索引擎的相关技术作了详细的分析和讨论,论述了目前搜索引擎的国内外发展现状和趋势。分析了搜索引擎的工作原理及其各部分主要功能,抓住如何评价页面的主题相关性和设计高效的爬行策略这两个关键问题,提出一个基于丝绸信息的定题搜索器,它是垂直搜索引擎的核心。在文章的主体部分,以搜索引擎的设计流程为主线,重点论述垂直搜索引擎设计与实现时一些独特的信息识别方法,包括pagerank和HITS算法。从HTML页面解析的一般概念入手,结合网页之间的超链接分析,按照搜索引擎系统的要求,采用深度优先的搜索策略设计具有垂直搜索引擎功能的丝绸信息网站。并按照软件工程的方法,研究了丝绸信息搜索引擎的总体设计过程和实现过程,设计过程重点论述...
内容来自转载请标明出处.
本文关键词:面向丝绸领域的垂直搜索引擎关键算法研究,,由笔耕文化传播整理发布。
本文编号:162248
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/162248.html