基于林业主题的PageRank算法优化的研究
本文关键词:基于林业主题的PageRank算法优化的研究
【摘要】:PageRank(网页排名)是一种网络排序算法,每个网页都可以根据PageRank算法得出网页的PageRank值,但仅根据PageRank值的大小不能够准确找到符合主题的网页,会造成主题的漂移。为了使检索到的主题准确,针对目前通用排序算法对林业主题信息查准率较低的不足,根据需要的林业主题建立特定的爬虫算法。定义了林业主题文本库,分析文本库特征值,通过改进的TF-IDF算法计算主题权重,对PageRank算法进行优化,提出了基于林业主题的PageRank算法,有效地提高了林业主题抓取的准确率。
【作者单位】: 东北林业大学信息与计算机工程学院;
【关键词】: 网页排名 林业主题 主题相关度有效
【基金】:林业公益性行业科研专项经费资助项目(201504307) 黑龙江省自然科学基金资助项目(ZD201403)
【分类号】:TP393.092
【正文快照】: 0引言我国的林业信息技术飞速发展,已经由“数字林业”步入“智慧林业”[1]阶段。在大数据时代,网络上的信息面临着指数型的增长[2],人们需要更高效、更准确的获取网络上的林业信息。然而,网络上通用的搜索引擎检索到的数据利用价值不高,无法抓住重点,不能满足人们对于专业领
【相似文献】
中国期刊全文数据库 前10条
1 钟灵;章云;曾启杰;罗文良;;能见度与缺失分析的改进PageRank算法[J];微计算机信息;2009年15期
2 LIU Gui-mei;;An adaptive improvement on PageRank algorithm[J];Applied Mathematics:A Journal of Chinese Universities(Series B);2013年01期
3 史铭茗;;加权PageRank算法研究综述[J];软件导刊;2013年02期
4 刘悦;程学旗;李国杰;;提高PageRank算法效率的方法初探[J];计算机科学;2002年06期
5 张巍,李志蜀;基于PageRank算法的搜索引擎优化策略[J];计算机应用;2005年07期
6 戚华春,黄德才,郑月锋;具有时间反馈的PageRank改进算法[J];浙江工业大学学报;2005年03期
7 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期
8 杨彬;康慕宁;;基于概念的权重PageRank改进算法[J];情报杂志;2006年11期
9 张丽;;PageRank算法的改进[J];科学技术与工程;2007年05期
10 孔娟;马亨冰;;PageRank算法的原理与解析[J];福建电脑;2007年01期
中国重要会议论文全文数据库 前10条
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中国控制与决策会议论文集(3)[C];2009年
2 刘松彬;都云程;施水才;;基于分解转移矩阵的PageRank迭代计算方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
7 李洋涛;李川;许超;雷晓;徐洪宇;唐常杰;杨宁;;空间评分:基于PageRank的信息网络可视化中节点重要性度量[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
9 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全国复杂系统研究论坛论文集(一)[C];2005年
中国硕士学位论文全文数据库 前10条
1 何逍;复杂网络的可视化显示[D];电子科技大学;2015年
2 李金圻;基于Hadoop的微博舆情分析[D];北京邮电大学;2015年
3 孙乐天;基于PageRank和对象关系的聚类算法研究[D];兰州大学;2016年
4 蔡建超;基于PageRank算法的搜索引擎优化研究[D];江南大学;2008年
5 邵晶晶;基于PageRank排序算法改进的若干研究[D];华中师范大学;2009年
6 王磊;PageRank的算法改进[D];上海交通大学;2009年
7 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年
8 姜sバ,
本文编号:702016
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/702016.html