基于改进PageRank算法的微博用户影响力研究
发布时间:2019-09-16 22:43
【摘要】:近年来微博呈现出爆炸式发展,已经成为人们运用互联网进行沟通的一种重要途径。在微博网络中用户是其核心,通过对微博用户特征以及其对微博信息传播所起到的作用的研究发现,少量核心用户对网络中信息传播起到引导作用。而目前针对微博网络用户影响力排名的相关研究都只给出用户影响力排名的先后顺序,却不能判断哪些用户对微博网络中信息传播起到引导作用的问题。本文通过对微博网络信息传递方式和微博网络模型的分析和研究,提出了一种微博用户网络领导小组识别算法。该算法可成为微博舆情追踪、舆情监控等相关研究的参考与借鉴。 本文的主要工作包括以下几个方面: 1、通过对微博网络信息传递方式的分析和研究,构建了微博信息传播网络模型。通过对微博僵尸粉和微博网络模型实例的研究,提出微博网络领导小组这一概念,并证实了它在微博网络信息传递过程中所起到的巨大的影响作用。 2、针对传统PageRank算法多次迭代的计算过程会带来很高的算法时间复杂度和空间复杂度的问题,通过对基于传统PageRank算法的微博用户影响力排序算法的研究和分析,提出运用个性化PageRank算法来进行微博用户影响力的计算,从而降低计算的时间复杂度和空间复杂度。 3、通过对现有微博用户影响力研究进行分析,针对现有微博用户影响力排序算法都无法确定微博网络领导小组的问题,,本文基于个性化PageRank算法结合微博网络结构和微博用户个人信息特征提出用于识别微博网络领导小组的LeadersRank算法,并把该算法应用到实际的微博网络运算中,得到了腾讯微博中标签为“IT民工”的微博用户的领导小组成员,验证了该算法的可行性和有效。
【图文】:
微博用户网络模型
相反,若某用户只关注很少的用户,他的出度就很小,那么可以认为该用户不属于活跃用户,甚至有可能是网络上所谓的水军或僵尸粉,这一类用户能够提高某些用户的PR值排名。图2.2是微博网络的出度分布,基本呈幂律形式的分布:P(k) ,其中 r=0.725,具有无标度网络的特性,即度分布符合幂律分布的复杂网络[16]。图 2.2 微博网络的出度分布图在图 2.2 中,横坐标代表微博用户的出度值,纵坐标代表该出度值占所有用户节点的比。图中占总用户节点的 58%,他们的出度分布在 0-100 这个区间,说明处于这个区间的用户关注的人数在 0-100 之间,相对较少。分析这部分用户节点
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092
【图文】:
微博用户网络模型
相反,若某用户只关注很少的用户,他的出度就很小,那么可以认为该用户不属于活跃用户,甚至有可能是网络上所谓的水军或僵尸粉,这一类用户能够提高某些用户的PR值排名。图2.2是微博网络的出度分布,基本呈幂律形式的分布:P(k) ,其中 r=0.725,具有无标度网络的特性,即度分布符合幂律分布的复杂网络[16]。图 2.2 微博网络的出度分布图在图 2.2 中,横坐标代表微博用户的出度值,纵坐标代表该出度值占所有用户节点的比。图中占总用户节点的 58%,他们的出度分布在 0-100 这个区间,说明处于这个区间的用户关注的人数在 0-100 之间,相对较少。分析这部分用户节点
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092
【参考文献】
相关期刊论文 前10条
1 樊鹏翼;王晖;姜志宏;李沛;;微博网络测量研究[J];计算机研究与发展;2012年04期
2 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期
3 杨长春;俞克非;叶施仁;严水歌;丁虹;杨晶;;一种新的中文微博社区博主影响力的评估方法[J];计算机工程与应用;2012年25期
4 金鑫;谢斌;朱建明;;基于复杂网络分析的微博网络舆情传播[J];吉林大学学报(工学版);2012年S1期
5 方明;方意;;一种新型智能僵尸粉甄别方法[J];计算机工程;2013年04期
6 张s
本文编号:2536465
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2536465.html