学术论文排序预测算法研究
发布时间:2017-09-18 17:21
本文关键词:学术论文排序预测算法研究
更多相关文章: 文献排名预测 引文网络 合著网络 PageRank
【摘要】:论文排名预测是通过一定的算法预测论文的价值,并按预测结果对论文排名。在学术社会网络中,排名预测算法能够给出在未来也会持续得到关注的论文,这对于科技工作者把握当前及未来的研究方向起着积极的指导作用。目前常用的学术论文排名标准包括PageRank、HITS等。这些传统的文献评价方法,主要通过文献的引用进行重要性传递对论文进行评价。然而,在引文网络中引用关系暗含着知识的传递,即引文与被引文献之间文本的关联程度,这种关联程度影响着引文对被引文的重要性传递,且对于传统的评价方法来说,引文网络只是当前时间的一个快照,存在新节点排挤问题。同时,典型的论文排名预测算法CiteRank只考虑了论文的发表时间,FutureRank算法仅涉及论文的发表时间、作者权威度和论文已有的PageRank值。此外,学术关系发展呈现多样性,学者在检索论文时,会考虑多种因素,如引文次数、相似度、期刊/会议的影响力、作者权威度等,这些因素也隐含对文献的价值的评估。因此,我们在对文献排序预测时应综合考虑各种可能对论文价值评估产生影响的特征。针对以上方法存在的问题,我们提出了通过预测文献相对引用次数实现对文献未来排序的算法FRP(Future Ranking Prediction)。FRP算法包括以下四步:(1)基于引文与被引文的文本间的关联强度、引用的新旧对论文重要性传递的影响,通过引文网络分别计算论文的PageRank值、波纳西茨权力指数;(2)通过引文网络和合著网络获得作者的文献发表量、权威度、平均被引次数以及合著特征;(3)结合引文网络与论文发表时间抽取文献的引用率;(4)利用(1)(2)(3)抽取的特征,通过BP神经网络学习来预测文献未来排序。实验结果表明FRP方法提高了预测准确率。
【关键词】:文献排名预测 引文网络 合著网络 PageRank
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要4-6
- ABSTRACT6-11
- 第一章 绪论11-16
- 1.1 选题背景及意义11-12
- 1.2 研究现状12-14
- 1.3 主要研究内14
- 1.4 本文的组织机构14-16
- 第二章 相关理论和技术16-24
- 2.1 LDA模型16-18
- 2.2 引文网络18
- 2.3 文献排名算法18-21
- 2.3.1 基于PageRank文献排名算法18-19
- 2.3.2 基于波纳西茨权力指数的文献排名算法19-20
- 2.3.3 基于HITS文献排名算法20-21
- 2.4 作者特征21-23
- 2.4.1 H-index21-22
- 2.4.2 合著特征22-23
- 2.5 引用特征23-24
- 第三章 学术论文排序预测算法研究24-34
- 3.1 总体框架24-25
- 3.2 特征提取25-31
- 3.2.1 基于文本特征的PageRank值25-27
- 3.2.2 基于时间的波纳西茨权力指数特征27-28
- 3.2.3 作者特征28-31
- 3.2.3.1 学者合著关系29-30
- 3.2.3.2 作者重要性30
- 3.2.3.3 文献发表量30-31
- 3.2.3.4 平均被引次数31
- 3.2.4 引用率31
- 3.3 学习模型31-33
- 3.4 本章小结33-34
- 第四章 实验与分析34-43
- 4.1 实验数据及预处理34-35
- 4.2 评价标准35
- 4.3 实验结果35-43
- 第五章 总结和展望43-45
- 5.1 工作总结43
- 5.2 工作展望43-45
- 参考文献45-49
- 致谢49
【参考文献】
中国硕士学位论文全文数据库 前2条
1 薛锐青;基于作者权威值的论文排名预测算法研究[D];吉林大学;2012年
2 刘乐;基于学术社会网络特征的专家搜索算法[D];内蒙古大学;2014年
,本文编号:876833
本文链接:https://www.wllwen.com/wenshubaike/lwzy/876833.html