搜索引擎中网络爬虫策略在烟草行业中的应用研究
发布时间:2017-10-22 10:17
本文关键词:搜索引擎中网络爬虫策略在烟草行业中的应用研究
【摘要】:搜索引擎中网络爬虫是一个重要组成部分,在行业搜索引擎中数据的查全查准得依靠网络爬虫对海量数据的抓取作用,网络爬虫如何在行业中发挥重要作用抓取出高效数据呢?将以烟草行业为例,针对网络爬虫的各个策略如深度优先策略、广度优先策略等策略分析其在行业搜索引擎中的应用。
【作者单位】: 浙江理工大学信息电子学院;
【关键词】: 网络爬虫 深度优先策略 广度优先策略
【分类号】:TP391.3
【正文快照】: 网络爬虫也称蜘蛛程序(Spider),是一个自动提取网页的程序,在搜索引擎中占据重要位置。网络爬虫对搜索引擎的查全、查准很有影响,对于爬虫来说就是尽可能多和快地给索引部分输送网页。网络爬虫的好坏直接影响搜索结果页中的死链接的个数。搜索引擎中网络爬虫的策略包括深度优,
本文编号:1077930
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1077930.html