基于改进PageRank算法的作者影响力评价指标研究
发布时间:2021-06-26 05:48
作者是学术交流的主体,也是创新力量的主要组成部分,在推动文化传承和科技创新方面发挥着关键作用。随着研究深度和广度的增加,科研人员数量的不断增长,作者之间的交流互动也变得更加密切。作者引用网络是一种体现作者引用关系的复杂网络,网络中的知识链接对信息资源传播以及不同学科间的合作发展具有重要意义。本研究基于作者引用网络,通过改进Page Rank算法探究作者学术影响力的评价指标。通过梳理利用Page Rank算法评价作者影响力的方法,发现已有研究中鲜有考虑论文被引时间异质性、作者贡献差异性等因素。本文在前人研究的基础上,从论文被引时间异质性和作者贡献差异性这两个角度改进PageRank算法,提出识别作者影响力的有效方法。其主要内容分为以下几个部分:(1)概述作者影响力评价的研究背景、研究意义。从网络视角和Page Rank算法两个方面入手,梳理涉及作者影响力评价的国内外研究,为新方法的提出奠定基础。(2)针对现有利用PageRank算法评价作者影响力的研究中鲜有考虑论文被引时间异质性这一问题,本研究提出基于论文被引时间异质性改进PageRank算法的Time-Page Rank指标。利用作者...
【文章来源】:曲阜师范大学山东省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
链接网络图
第2章相关理论与方法概述122.2.3作者引用网络与网页链接网络的比较“引用”将施引作者和被引作者联系在一起,数量较多时便形成网状结构。其中有许多共引关系和耦合关系,如图2-1所示。“链接”将施链和被链网页连接在一起,数量较大时也形成一种网状结构,按同样方法,可以描绘出“Web图”,如图2-2所示。其中同样存在类似于同引和耦合结构—共链。图2-1引文时序网络图图2-2链接网络图观察图2-1和图2-2可以发现,两种网络的整体结构非常相似。首先,网络节点都代表各自的研究主体,只是具体指代对象不同。作者引用网络的主体是作者;网页链接网络的主体是网页。其次,两个网络都是有向图,在作者引用网络中表示作者间的引用和被引关系;对网页链接网络来说,即为网页间的链入和链出关系①。两种网络图都是从网络视角来测度主体的影响力高低,其本质上都是利用链接数量和质量对该节点进行判断评价。具体而言,两者又具有不同的地方,主要体现为以下几个方面:(1)作者引用网络是不可变的,网页链接网络是可变的。作者引用网络不能在任何已有节点增加新的施引单向箭头②。即当一篇论文发表后,它所参考的作者数目、文献的数目和名称就不再改变了。但网页链接网络是可以变化的,即网页链接网络中的链接可以①王曼丽.组合凸线性感知器在文本分类中的应用及评测研究[D].北京:北京工业大学,2016.②苏芳荔.文献引文分析、网络链接分析和网络引文分析的比较[J].情报探索,2010(1):11-13.
第2章相关理论与方法概述140.50.20.20.50.2利用以上两个假设,PageRank算法开始赋予每个网站或者网页相同的得分,通过递归迭代计算并更新,直至每个网页的PageRank值稳定。2.3.2PageRank算法的计算根据以上理论,该算法的运行过程主要分为以下两个阶段:(1)初始阶段:网页之间根据链接关系形成网页链接网络。对于该网络中的网页进行PageRank值的计算。在计算开始前给每一个网页赋予相同的PageRank值,经过多次迭代计算,每个网页的PageRank值会不断地更新。(2)更新阶段:每经过一轮计算,网页都会将新的PageRank值平均分配给当前网页所拥有的出链网页上,使每个网页链接都获得相同的权值。网页PageRank值为所有指向该网页的PageRank值权值总和。如图2-3所示:图2-3链接结构的部分网页及PageRank值为了更加方便地理解PageRank算法,我们以图示进行说明整个的运算过程。假设存在4个页面分别为:A、B、C、D,箭头指向代表其相互的跳转方向,如图2-4所示。图2-4Web拓扑结构0.710.60.20.7
【参考文献】:
期刊论文
[1]学术评价研究的新视角[J]. 李秀霞. 信息资源管理学报. 2019(04)
[2]一种学术影响力评价新指标及其改进方法研究[J]. 张学梅. 图书馆研究与工作. 2019(05)
[3]基于加权被引频次与署名顺序的作者影响力评价指标构建[J]. 谢瑞霞,李秀霞,韩霞,史盛楠. 情报科学. 2018(08)
[4]一种基于PageRank和时间衰退因子的作者影响力评价方法[J]. 崔景洋. 廊坊师范学院学报(自然科学版). 2018(02)
[5]基于作者互引的学科内部专业间知识交流探测——以图书情报档案学学科为例[J]. 李婷婷,刘超,李秀霞. 情报科学. 2018(06)
[6]基于改进PageRank算法的核心专利发现研究[J]. 张欣,马瑞敏. 图书情报工作. 2018(10)
[7]基于PageRank的用户影响力评价改进算法[J]. 王顶,徐军,段存玉,吴玥瑶,孙静. 哈尔滨工业大学学报. 2018(05)
[8]基于作者贡献权重的学术迹在学者学术影响力评价中的应用[J]. 唐璞妮,徐苑琳. 情报资料工作. 2018(02)
[9]多维度量化科研人员影响力的指标——EMC指数[J]. 张勤. 情报杂志. 2018(02)
[10]基于CSSCI我国高校数字图书馆研究论文的统计分析[J]. 王克平,陈辰,车尧. 情报科学. 2017(10)
博士论文
[1]学术期刊评价方法综合比较研究[D]. 张朋.中国科学技术大学 2018
硕士论文
[1]基于“时间异质性”和“合著网络”的作者影响力评价研究[D]. 谢瑞霞.曲阜师范大学 2019
[2]面向引文网络的科学文献影响力评价和社区发现研究[D]. 冯磊.北京工业大学 2018
[3]基于多信息融合的科技文献重要度评价方法的分析与研究[D]. 张甫.北京工业大学 2016
[4]组合凸线性感知器在文本分类中的应用及评测研究[D]. 王曼丽.北京工业大学 2016
[5]PageRank算法应用在文献检索排序中的研究及改进[D]. 汪志伟.南昌大学 2016
本文编号:3250752
【文章来源】:曲阜师范大学山东省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
链接网络图
第2章相关理论与方法概述122.2.3作者引用网络与网页链接网络的比较“引用”将施引作者和被引作者联系在一起,数量较多时便形成网状结构。其中有许多共引关系和耦合关系,如图2-1所示。“链接”将施链和被链网页连接在一起,数量较大时也形成一种网状结构,按同样方法,可以描绘出“Web图”,如图2-2所示。其中同样存在类似于同引和耦合结构—共链。图2-1引文时序网络图图2-2链接网络图观察图2-1和图2-2可以发现,两种网络的整体结构非常相似。首先,网络节点都代表各自的研究主体,只是具体指代对象不同。作者引用网络的主体是作者;网页链接网络的主体是网页。其次,两个网络都是有向图,在作者引用网络中表示作者间的引用和被引关系;对网页链接网络来说,即为网页间的链入和链出关系①。两种网络图都是从网络视角来测度主体的影响力高低,其本质上都是利用链接数量和质量对该节点进行判断评价。具体而言,两者又具有不同的地方,主要体现为以下几个方面:(1)作者引用网络是不可变的,网页链接网络是可变的。作者引用网络不能在任何已有节点增加新的施引单向箭头②。即当一篇论文发表后,它所参考的作者数目、文献的数目和名称就不再改变了。但网页链接网络是可以变化的,即网页链接网络中的链接可以①王曼丽.组合凸线性感知器在文本分类中的应用及评测研究[D].北京:北京工业大学,2016.②苏芳荔.文献引文分析、网络链接分析和网络引文分析的比较[J].情报探索,2010(1):11-13.
第2章相关理论与方法概述140.50.20.20.50.2利用以上两个假设,PageRank算法开始赋予每个网站或者网页相同的得分,通过递归迭代计算并更新,直至每个网页的PageRank值稳定。2.3.2PageRank算法的计算根据以上理论,该算法的运行过程主要分为以下两个阶段:(1)初始阶段:网页之间根据链接关系形成网页链接网络。对于该网络中的网页进行PageRank值的计算。在计算开始前给每一个网页赋予相同的PageRank值,经过多次迭代计算,每个网页的PageRank值会不断地更新。(2)更新阶段:每经过一轮计算,网页都会将新的PageRank值平均分配给当前网页所拥有的出链网页上,使每个网页链接都获得相同的权值。网页PageRank值为所有指向该网页的PageRank值权值总和。如图2-3所示:图2-3链接结构的部分网页及PageRank值为了更加方便地理解PageRank算法,我们以图示进行说明整个的运算过程。假设存在4个页面分别为:A、B、C、D,箭头指向代表其相互的跳转方向,如图2-4所示。图2-4Web拓扑结构0.710.60.20.7
【参考文献】:
期刊论文
[1]学术评价研究的新视角[J]. 李秀霞. 信息资源管理学报. 2019(04)
[2]一种学术影响力评价新指标及其改进方法研究[J]. 张学梅. 图书馆研究与工作. 2019(05)
[3]基于加权被引频次与署名顺序的作者影响力评价指标构建[J]. 谢瑞霞,李秀霞,韩霞,史盛楠. 情报科学. 2018(08)
[4]一种基于PageRank和时间衰退因子的作者影响力评价方法[J]. 崔景洋. 廊坊师范学院学报(自然科学版). 2018(02)
[5]基于作者互引的学科内部专业间知识交流探测——以图书情报档案学学科为例[J]. 李婷婷,刘超,李秀霞. 情报科学. 2018(06)
[6]基于改进PageRank算法的核心专利发现研究[J]. 张欣,马瑞敏. 图书情报工作. 2018(10)
[7]基于PageRank的用户影响力评价改进算法[J]. 王顶,徐军,段存玉,吴玥瑶,孙静. 哈尔滨工业大学学报. 2018(05)
[8]基于作者贡献权重的学术迹在学者学术影响力评价中的应用[J]. 唐璞妮,徐苑琳. 情报资料工作. 2018(02)
[9]多维度量化科研人员影响力的指标——EMC指数[J]. 张勤. 情报杂志. 2018(02)
[10]基于CSSCI我国高校数字图书馆研究论文的统计分析[J]. 王克平,陈辰,车尧. 情报科学. 2017(10)
博士论文
[1]学术期刊评价方法综合比较研究[D]. 张朋.中国科学技术大学 2018
硕士论文
[1]基于“时间异质性”和“合著网络”的作者影响力评价研究[D]. 谢瑞霞.曲阜师范大学 2019
[2]面向引文网络的科学文献影响力评价和社区发现研究[D]. 冯磊.北京工业大学 2018
[3]基于多信息融合的科技文献重要度评价方法的分析与研究[D]. 张甫.北京工业大学 2016
[4]组合凸线性感知器在文本分类中的应用及评测研究[D]. 王曼丽.北京工业大学 2016
[5]PageRank算法应用在文献检索排序中的研究及改进[D]. 汪志伟.南昌大学 2016
本文编号:3250752
本文链接:https://www.wllwen.com/kejilunwen/yysx/3250752.html