搜索引擎的渐增式爬行和备份式更新模式
本文选题:搜索引擎 + 爬行器 ; 参考:《华东理工大学学报》2004年03期
【摘要】:介绍了搜索引擎的总体结构,分析了搜索引擎中爬行器的爬行策略和网页库的更新模式。介绍了其中一种较为合理的爬行和更新模式及其实现技术,实现了渐增式地爬行高质量网页和提高网页库新鲜度的目的。
[Abstract]:This paper introduces the general structure of search engine, analyzes the crawler's crawling strategy in search engine and the updating mode of web page library. This paper introduces one of the more reasonable crawling and updating modes and its realization technology, which realizes the purpose of creeping high quality pages and improving the freshness of web pages library.
【作者单位】: 华东理工大学计算机科学与工程系 焦作大学计算机工程系 华东理工大学计算机科学与工程系
【基金】:上海市青年科技启明星计划资助项目(99QD14038)
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 赫枫龄,左万利;用有向图法解决网页爬行中循环链接问题[J];吉林大学学报(理学版);2004年03期
2 沈文勤,李庆超,邵志清;搜索引擎的渐增式爬行和备份式更新模式[J];华东理工大学学报;2004年03期
3 杨威;FrontPage98在企业Intranet中的应用(六)[J];通信世界;1998年10期
4 卢峰;Frontpage 98的网页编辑[J];电脑技术;1999年03期
5 ;Web Painter 3.0功能完整的网页绘图及动画处理软件[J];电子出版;1999年01期
6 李宗宏;如何利用FrontPage Express制作主页[J];计算机时代;1999年11期
7 ;网上先生——教您上网(四) 上网第四站[J];市场与电脑;1999年07期
8 ;站点扫描[J];计算机周刊;1999年17期
9 云起;信息人——你有网页吗[J];计算机周刊;1999年22期
10 李新 ,杨章远 ,许志宏;在网页中实现自定义滚动条[J];电脑编程技巧与维护;1999年10期
相关会议论文 前10条
1 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 白清源;林锦贤;谢丽聪;;信息自动获取系统的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 冯艳卉;洪宇;颜振祥;姚建民;朱巧明;;基于搜索引擎的双语混合网页识别新方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 江志纲;丁增喜;刘洋;王大玲;鲍玉斌;于戈;;基于面向属性规约方法的网页和超链的分类[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
5 孔辉;梁洪亮;辛阳;杨义先;陈林顺;;一种高性能的网页篡改检测与恢复机制[A];2010年全国通信安全学术会议论文集[C];2010年
6 刘晖;赵萍;;新疆环境气象中心网站的总体规划及建设[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
7 李立宗;高铁杠;陈蓉;陈超;;基于混沌系统的web信息隐藏研究与实现[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
8 王玉龙;叶新铭;李秀华;;网页优化策略的模糊C均值(FCM)聚类算法研究(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 朱建国;孙钟德;刘婷;;地市级网络管理监控初探[A];“推进气象科技创新,,提高防灾减灾和应对气候变化能力”——江苏省气象学会第七届学术交流会论文集[C];2011年
10 郑传新;谢筱惠;;基于网页技术的决策气象服务信息系统[A];2002年广西气象电子专业技术交流会论文集[C];2002年
相关重要报纸文章 前10条
1 任悦采写 本报记者 方妍;照片买家说,网页繁复不招喜欢[N];中国摄影报;2009年
2 鸣涧;走近3D梦幻网页(3)[N];中国电脑教育报;2002年
3 湖南 Ringfo;防止你的网页被“偷拍”[N];电脑报;2002年
4 路人甲;在网页上圈圈点点[N];电脑报;2004年
5 湖南 郭荣辉;网页图片保存四法[N];电子报;2005年
6 鸣涧;初次握手3D网页[N];中国电脑教育报;2002年
7 李芳香;和网页垃圾说再见[N];中国电脑教育报;2002年
8 马淑芬 记者 吴岳福;宝清 率先启动“村村通网页”工程[N];黑龙江日报;2010年
9 鸣涧;网页的编辑[N];中国电脑教育报;2002年
10 辽宁 张策;滚动的字幕 滚动的网页[N];中国电脑教育报;2002年
相关博士学位论文 前10条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 覃健诚;网络多层纵深防御体系的关键技术研究[D];北京邮电大学;2011年
4 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
5 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
6 黄小广;港美经济关系研究[D];暨南大学;2008年
7 窦平安;电子商务语义信息共享模式[D];吉林大学;2009年
8 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
9 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
10 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年
相关硕士学位论文 前10条
1 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
2 王祥冰;个人网页人际意义构建的多模态分析[D];西南交通大学;2012年
3 孙学刚;面向奥运的中文网页信息获取方法的初步研究[D];清华大学;2004年
4 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
5 邱鹏;移动终端网页转换系统的设计与实现[D];大连理工大学;2012年
6 涂涛;嵌入式浏览器网页排版技术的研究与实现[D];华中科技大学;2004年
7 马千驰;基于搜索词的网页结果聚类研究与应用[D];华南理工大学;2010年
8 云颖;复杂网络中的社区发现及进化研究[D];河北大学;2011年
9 颜振祥;互联网双语资源挖掘关键技术研究[D];苏州大学;2010年
10 张勇辉;网页游戏《时空》商业策划书[D];华南理工大学;2010年
本文编号:1788349
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1788349.html