林业主题爬虫的算法研究与设计
本文选题:林业 切入点:主题爬虫 出处:《计算机工程与设计》2011年06期 论文类型:期刊论文
【摘要】:针对目前通用搜索引擎对林业主题信息覆盖率和查准率较低的不足,提出了一种基于Shark-Search算法的林业主题爬虫设计方案。详细讨论了该主题爬虫的爬行策略、算法描述及实现,并通过实践构建了林业主题搜索引擎"搜林"。实验结果表明,相对于通用搜索引擎,"搜林"减少了搜索结果的信息量,提高了林业主题信息搜索的准确率。
[Abstract]:Aiming at the lack of low coverage and precision of forestry subject information in general search engine at present, a design scheme of forestry subject crawler based on Shark-Search algorithm is proposed, and the crawling strategy, algorithm description and implementation of this topic crawler are discussed in detail. The experiment results show that compared with the general search engine, "searching forest" reduces the amount of information of the search results and improves the accuracy of the forestry subject information search.
【作者单位】: 北京林业大学信息学院;
【分类号】:TP391.3
【参考文献】
相关期刊论文 前2条
1 曹红,袁津生;林业主题搜索引擎研究[J];计算机应用;2004年S2期
2 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
【共引文献】
相关博士学位论文 前1条
1 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
相关硕士学位论文 前10条
1 柳周频;基于链接上下文的网页预测[D];吉林大学;2006年
2 程岚岚;面向领域的中文搜索引擎若干关键技术研究[D];天津大学;2006年
3 王平;基于用户偏好挖掘和主题搜索的情报推荐系统[D];浙江大学;2007年
4 苏晓珂;基于Nutch的主题爬虫研究与实现[D];昆明理工大学;2007年
5 彭鹏;基于本体的信息检索策略优化研究[D];吉林大学;2007年
6 谢德辉;面向刑侦网页的信息抽取与主题爬虫应用研究[D];大连理工大学;2007年
7 李君梅;基于Web Community识别的聚焦爬虫算法研究与设计[D];浙江大学;2008年
8 王磊;公安网络舆情分析系统的研究[D];北京交通大学;2008年
9 杨梅;网络舆情热点发现的研究[D];北京交通大学;2008年
10 姚玉霞;基于多智能体人工鱼群算法应用研究[D];西安建筑科技大学;2008年
【二级参考文献】
相关期刊论文 前10条
1 刘挺,吴岩,王开铸;最大概率分词问题及其解法[J];哈尔滨工业大学学报;1998年06期
2 陈治平,林亚平,童调生;基于N层向量空间模型的信息检索算法[J];计算机研究与发展;2002年10期
3 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
4 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期
5 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
6 刘建舟,何婷婷,骆昌日;基于语料库和网络的新词自动识别[J];计算机应用;2004年07期
7 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
8 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期
9 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
10 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
【相似文献】
相关期刊论文 前10条
1 王芳;陈海建;;深入解析Web主题爬虫的关键性原理[J];微型电脑应用;2011年07期
2 黄轩;;辛亥革命史主题爬虫的设计与实现[J];电脑知识与技术;2011年13期
3 ;坚持“五个到位” 推进办公自动化[J];林业与生态;2011年08期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前2条
1 袁传武;;湖北省林业科学研究院办公自动化系统的研建[A];第二届中国林业学术大会——S3 森林经理与林业信息化的新使命论文集[C];2009年
2 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
相关重要报纸文章 前1条
1 李玮;信息可视化技术在林业信息化中的应用[N];中国计算机报;2003年
相关博士学位论文 前1条
1 陈玮;基于ASP的国有林区区域信息化模式研究[D];东北林业大学;2009年
相关硕士学位论文 前10条
1 王斐;基于增量反馈和自适应机制的主题爬虫系统的设计与实现[D];南京理工大学;2005年
2 刘朋;基于Lucene的垂直搜索引擎关键技术的研究应用[D];武汉理工大学;2009年
3 谢德辉;面向刑侦网页的信息抽取与主题爬虫应用研究[D];大连理工大学;2007年
4 孙逸雪;基于时态信息的主题搜索引擎的研究与实现[D];中国科学技术大学;2009年
5 韩冰;基于BP网络的高校主题爬虫的设计与实现[D];东北师范大学;2009年
6 袁浩;主题爬虫搜索Web页面策略的研究[D];中南大学;2009年
7 吴世杰;基于支持向量机分类算法的主题爬虫的研究与实现[D];华中师范大学;2009年
8 杨丹波;应用Web数据挖掘的主题元搜索引擎设计与实现[D];清华大学;2009年
9 程锦;面向网络化制造资源的垂直搜索技术研究与应用[D];贵州大学;2007年
10 杜光芹;效用驱动的主题Web挖掘算法研究[D];山东师范大学;2007年
,本文编号:1570111
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1570111.html