社科论文管理论文经济论文科技论文教育论文文艺论文医学论文外语论文硕博论文法律论文理工论文农业论文

当前位置：主页 > 科技论文 > 搜索引擎论文 >

基于关键词相关度的Deep Web爬虫爬行策略

发布时间：2019-07-25 15:30

【摘要】：Deep Web蕴藏丰富的、高质量的信息资源,为了获取某Deep Web站点的页面,用户不得不键入一系列的关键词集。由于没有直接指向Deep Web页面的静态链接,目前大多数搜索引擎不能发现这些页面。该文提出的Deep Web爬虫爬行策略,可以有效地下载Deep Web页面。由于该页面只提供一个查询接口,因此Deep Web爬虫设计面对的主要挑战是怎样选择最佳的查询关键词产生有意义的查询。实验证明文中提出的一种基于不同关键词相关度权重的选择方法是有效的。
[Abstract]:Deep Web contains rich and high quality information resources. In order to obtain the page of a Deep Web site, users have to type a series of keyword sets. Most search engines are currently unable to find Deep Web pages because there are no static links to them. The Deep Web crawler crawling strategy proposed in this paper can effectively download Deep Web pages. Because the page provides only one query interface, the main challenge for Deep Web crawler design is how to select the best query keywords to generate meaningful queries. The experimental results show that the proposed method is effective based on the correlation weight of different keywords.
【作者单位】：上海理工大学计算机工程学院;
【分类号】：TP393.09

【相似文献】

相关期刊论文前10条

1 叶允明,于水,马范援,宋晖,张岭;分布式Web Crawler的研究:结构、算法和策略[J];电子学报;2002年S1期

2 潘春华,冯太明,武港山;基于移动爬虫的专用Web信息收集系统的设计[J];计算机工程与应用;2003年36期

3 齐冬梅,杜亚军,李战胜;个性化智能搜索引擎爬行虫算法[J];计算机应用;2004年S2期

4 严亚兰,查先进;Web网页并行爬行研究[J];计算机应用研究;2005年04期

5 邵斐;孙济庆;;一种适用于动态网页的网络蜘蛛爬行策略研究[J];情报杂志;2007年05期

6 尹江;尹治本;黄洪;;网络爬虫效率瓶颈的分析与解决方案[J];计算机应用;2008年05期

7 田野;丁岳伟;;基于关键词相关度的Deep Web爬虫爬行策略[J];计算机工程;2008年15期

8 刘朋;林泓;高德威;;基于内容和链接分析的主题爬虫策略[J];计算机与数字工程;2009年01期

9 黄莉;王成良;杨铮;;面向主题网络爬行的智能隧道穿越算法研究[J];计算机应用研究;2009年08期

10 黄聪会;张水平;胡洋;;主题Deep Web爬虫框架研究[J];计算机工程与设计;2010年05期

相关硕士学位论文前3条

1 唐志;主题Web信息采集与分析技术研究[D];重庆大学;2006年

2 姚忠存;锚文本增量主题爬行[D];吉林大学;2007年

3 陈丛丛;主题爬虫搜索策略研究[D];山东大学;2009年

，

本文编号：2519178

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2519178.html

上一篇：检索调研环境自适应抓取算法的研究与实现
下一篇：AM真菌与紫穗槐形成丛枝菌根过程中差异蛋白质图谱库的构建

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

最近更新

教材专著

·主编|副主编|备案副主编|编委|参编

热点文章

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明：资料由用户b6efc***提供，本站仅收录摘要或目录，作者需要删除请E-mail邮箱bigeng88@qq.com