基于本体的主题网络爬虫设计
[Abstract]:Web crawler is an important part of search engine. The working principle of topic network crawler is analyzed, the calculation method of topic correlation degree is studied, the solution of topic network crawler based on ontology is put forward, and the evaluation experiment system is designed and implemented. Finally, the experimental results are compared and its feasibility is demonstrated.
【作者单位】: 武汉理工大学计算机科学与技术学院;
【分类号】:TP391.3
【参考文献】
相关期刊论文 前3条
1 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期
2 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
3 汪涛,樊孝忠;链接分析对主题爬虫的改进[J];计算机应用;2004年S2期
相关硕士学位论文 前1条
1 杜超华;基于本体的省情网垂直搜索引擎研究[D];华中师范大学;2007年
【共引文献】
相关期刊论文 前3条
1 赵佳鹤;王秀坤;刘亚欣;;基于语义分析的主题信息采集系统的设计与实现[J];计算机应用;2007年02期
2 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
3 王二平;Web站点结构及网页特征信息的抽取[J];吕梁高等专科学校学报;2004年02期
相关会议论文 前3条
1 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
2 姜丽华;张宏斌;;基于Multi-Agent的个性化Web信息采集系统[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
3 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
相关博士学位论文 前1条
1 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
相关硕士学位论文 前10条
1 王秋玲;基于RDF的Web资源管理关键技术研究与应用[D];解放军信息工程大学;2006年
2 朱玉丽;基于网格技术的主题爬虫算法优化的研究与实现[D];沈阳工业大学;2007年
3 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
4 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年
5 李新安;基于领域主题的Web信息检索技术研究[D];山东大学;2006年
6 马骊;基于搜索引擎技术的警情信息搜集系统的研究与实现[D];山东大学;2006年
7 赵佳鹤;基于语义分析的网络信息采集算法研究与应用[D];大连理工大学;2006年
8 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年
9 罗兵;支持AJAX的互联网搜索引擎爬虫设计与实现[D];浙江大学;2007年
10 孙雷;面向特定领域的智能搜索技术研究[D];哈尔滨工程大学;2007年
【二级参考文献】
相关期刊论文 前10条
1 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期
2 赵庆龄,钱平,苏晓路,赵明;本体论在基于Web的土壤知识体系智能检索系统中的应用[J];计算机工程与应用;2005年05期
3 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
4 万捷,滕至阳;本体论在基于内容信息检索中的应用[J];计算机工程;2003年04期
5 吴光远,何丕廉,曹桂宏,聂颂;基于向量空间模型的词共现研究及其在文本分类中的应用[J];计算机应用;2003年S1期
6 林春梅,何跃;创建企业本体模型的研究[J];计算机应用研究;2003年01期
7 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期
8 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
9 张元馨,赵仲孟,沈钧毅;一种基于向量空间模型的个性化搜索引擎研究[J];微电子学与计算机;2003年11期
10 黄国景,崔志明;基于Ontology的个性化元搜索引擎研究[J];微电子学与计算机;2004年12期
相关会议论文 前1条
1 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
【相似文献】
相关期刊论文 前10条
1 王宇,张秀彬;集群式智能型网络信息自动搜寻与采集系统[J];上海交通大学学报;1998年08期
2 朱岩;;四海一家 AltaVista推出全球索引[J];每周电脑报;1998年19期
3 林海;做个超级网虫——鹦鹉螺网络助手简介[J];计算机与网络;2001年15期
4 邓志鸿,唐世渭,杨冬青;基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究[J];计算机工程;2002年06期
5 汪小栋,董红斌;一种基于Linux平台的搜索引擎初探[J];计算机应用研究;2002年06期
6 潘春华 ,常敏 ,武港山;面向Web的信息收集工具的设计与开发[J];计算机应用研究;2002年06期
7 张晓星;基于知识管理的网络资源管理[J];国家图书馆学刊;2003年01期
8 曹科;基于Internet的信息挖掘研究[J];计算技术与自动化;2003年01期
9 Sergey Brin;Lawrence Page;万思;;Google搜索引擎剖析[J];程序员;2003年04期
10 刘琨,郑有才;搜索引擎剖析[J];微机发展;2004年03期
相关会议论文 前1条
1 朴星海;赵铁军;郑德权;张迪;;面向Blog的网络爬行器设计与实现[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
相关重要报纸文章 前2条
1 伍裕标;网络监控STOP![N];中国电脑教育报;2003年
2 王猛祥 徐明华;六度分隔:下一代网络交际[N];中国计算机报;2004年
相关硕士学位论文 前10条
1 王斐;基于增量反馈和自适应机制的主题爬虫系统的设计与实现[D];南京理工大学;2005年
2 刘宇波;面向可下载资源的WEB搜索引擎的设计与实现[D];湖南大学;2005年
3 车志军;人工智能在搜索引擎资源获取中的应用[D];浙江大学;2006年
4 王柏;中文资讯搜索引擎产品技术的研究和应用[D];吉林大学;2006年
5 苏旋;分布式网络爬虫技术的研究与实现[D];哈尔滨工业大学;2006年
6 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
7 林乐彬;Inar网络爬虫的设计与实现[D];哈尔滨工业大学;2006年
8 蒋科;基于领域概念定制的主题爬虫系统的设计与实现[D];西安电子科技大学;2007年
9 刘铮;定题Web搜索与挖掘的研究及系统实现[D];西安电子科技大学;2007年
10 罗兵;支持AJAX的互联网搜索引擎爬虫设计与实现[D];浙江大学;2007年
,本文编号:2486702
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2486702.html