当前位置:主页 > 社科论文 > 图书档案论文 >

基于Hadoop的学术文献排名及作者影响力评价算法

发布时间:2022-01-18 22:03
  随着科学技术的飞速发展,研究成果的产出量逐步提高,文献检索系统等电子媒介逐渐成为了学术成果的主要存储方式之一。面对海量电子文献数据,如何从中快速找到研究者们所需要的文献、作者信息,成为当前的一个亟待解决的问题。更准确的对文献进行排名、对学者的学术水平进行评价,可以减少普通研究者在进行文献、作者检索时所花费的代价,节省研究者的时间,使研究者快速了解某一领域内的研究重点、研究热点。传统的文献排名及作者影响力评价方法计算复杂度较高,难以处理海量文献数据。为了更合理的对海量学术数据中的文献进行排名、作者影响力进行评价,本文利用Hadoop云计算平台的数据处理能力,基于MapReduce计算框架对这两个问题进行了深入研究,主要工作包含以下两个方面:(1)提出了一种文献排名NTMP(Notave-Timefactor-Mapeduce-Pagerank)算法。改进了传统PageRank算法在进行文献排名计算时忽略文献发表时间对价值的影响以及迭代次数过多的问题。该算法基于MapReduce计算框架构建,加入了时间因素对于文献价值排名的影响,优化了迭代过程中NTMP值的分配过程。实验表明NTMP算法,... 

【文章来源】:河北地质大学河北省

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

基于Hadoop的学术文献排名及作者影响力评价算法


文献发表年限与被引数量关系图

文献,优化方法


文献影响力衰退图

对比图,运行时间,单次,迭代


图 3.6 单次迭代运行时间对比图代次数方面,因为改进了迭代过程中 NTMP 值的传输过程,使得 NT的流向质量高的文献,所以 NTMP 算法收敛速度更快。传统 PageRan6 次才能完成迭代,而 NTMP 算法只需要 75 次。如图 3.6 所示,在时间

【参考文献】:
期刊论文
[1]云环境下分布式文件系统负载均衡研究[J]. 吴瑶瑶,杨庚.  计算机工程与应用. 2019(10)
[2]一种基于PageRank和时间衰退因子的作者影响力评价方法[J]. 崔景洋.  廊坊师范学院学报(自然科学版). 2018(02)
[3]基于PageRank的用户影响力评价改进算法[J]. 王顶,徐军,段存玉,吴玥瑶,孙静.  哈尔滨工业大学学报. 2018(05)
[4]云计算数据中心HDFS差异性存储节能优化算法[J]. 杨挺,王萌,张亚健,赵英杰,盆海波.  计算机学报. 2019(04)
[5]一种类h指数实证分析及实践应用[J]. 宋振世.  现代情报. 2017(05)
[6]基于PageRank的微博用户影响力算法研究[J]. 孙红,左腾.  计算机应用研究. 2018(04)
[7]基于灰色关联分析的作者影响力综合评价方法[J]. 王雨,郭进利.  情报杂志. 2017(03)
[8]基于文献引文网络的学者学术影响力测度研究[J]. 刘萍,杨宇,邹德安.  情报理论与实践. 2017(03)
[9]科技期刊中“近年来”后引用参考文献的老化规律——以化学学科为例[J]. 陈丽萍,周英智.  中国科技期刊研究. 2016(12)
[10]三种权重赋权法的比较分析[J]. 吴希.  中国集体经济. 2016(34)

硕士论文
[1]基于灰色关联分析的多因子选股模型研究[D]. 王赟.北京交通大学 2017
[2]基于主题模型的社交媒体主题挖掘和文献影响力预测分析[D]. 邱洁.西南大学 2017
[3]基于引文网络的文献在线推荐系统研究和实现[D]. 马丙超.大连理工大学 2016
[4]文献排名预测算法及作者影响力评估算法研究[D]. 曾玮.西南大学 2014
[5]基于HDFS的云存储系统数据安全性研究[D]. 石磊庆.北京邮电大学 2013
[6]基于引用网络的学术文献排名算法研究[D]. 杜文杰.哈尔滨工程大学 2013



本文编号:3595670

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3595670.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b75fb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com