校园论坛用户影响力分析技术研究
发布时间:2020-08-17 10:07
【摘要】:当前,社交网络用户影响力分析及影响力排序已经成为社会网络研究领域当中的一项重要工作。网络论坛作为一个历史较长、技术成熟的在线社交平台,拥有大量的用户群体。本文以校园论坛为研究对象,对识别论坛中意见领袖的技术和方法进行研究。准确识别这些具有高影响力的意见领袖,对于引导信息传播、构建和谐校园具有现实意义。现有方法通常从社会网络结构和用户属性来进行影响力分析,而没有考虑用户影响力在时间维度上的衰减问题。为了准确识别论坛中的高影响力用户,本文首先基于不同时间点构建了多版本数据集,并建立用户交互网络模型和进行用户行为分析。相比于现有文献仅采用单一时间点的数据集合进行分析,本文采用全量结合增量的形式构建了多版本数据集,通过比较不同时间点不同版本间的数据差异,来对用户在时间轴上的行为变化进行分析,得到用户的行为变化规律服从幂律分布。同时,本文基于主题构建了以用户间交互次数为边权的用户交互网络模型,并用数据进行了实证,表明了该模型能够较好反映不同用户间的影响程度差异。基于上述工作以及PageRank算法存在的问题,本文提出了Time-User Rank影响力计算算法。该算法通过结合时间变量,考虑影响力的变化特性,基于论坛用户对主题帖回复概率随时间的变化情况,拟合得到影响力衰减系数公式,并将其引入到算法中。同时,算法利用用户间交互关系权重和用户主题参与度来对不同用户进行差异化分析,对节点的权值分配方式进行了优化。最后,实验验证了 Time-User Rank算法的效果,通过对比经典的PageRank算法表明,在单个时间段内,Time-User Rank算法能够识别出具有更强中心性特性和更高用户覆盖率的高影响力用户;在连续时间段上,由于引入了影响力衰减系数,Time-User Rank算法识别的用户具有相对较高且更稳定的用户覆盖率,达到更好的识别效果。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09
【图文】:
2017年6月,我国网民规模达到7.51亿,互联网普及率为54.3%,其中手机网逡逑民规模达到7.24亿[1]。结合CNNIC发布的数据,最近几年的中国网民规模和互逡逑联网普及率变化情况如图1-1所示:逡逑截止2017.06中国网民规模和互联网普及率(单位??万人)逡逑80o0a逦逦邋...逦6C’.G0s逡逑75116逡逑73125逦r逡逑70958逦逦逡逑68826邋逦-'逡逑70000逦66769逦逦逡逑64875逦SO.OO%逡逑_逦一^一^逡逑灥逦一-逡逑一*一*40.004逡逑姦逡逑5..!逦W[:■逡逑曊WWWW_W曑,H曊逡逑40000逦3。0邋的逡逑m_'r逡逑30000逡逑20.0(fi>逡逑脚逡逑佊逡逑10000逡逑11逦㈥h逦_W丨?"逦D逦It:丨逡逑0逦0.00?,逡逑2012.06逦2012.12逦2013.06逦2013.12逦20K.06逦2014.12逦2015.06逦2015.12逦2016.06逦2016.12逦2017.06逡逑Bsaws人数——荮及涿逡逑图1-1中国网民规模和互联网普及率⑴逡逑正是在互联网不断普及和移动互联技术不断发展的形式下,基于Web2.邋0技逡逑术的在线社交网络也随之得到不断的发展,涌现出多种形式的在线社交应用,越逡逑来越多的网民参与到在线社交网络当中,在线社交网络也逐渐成为社会新闻发布、逡逑舆论传播、个性化内容发布的重要平台。目前以新媒体应用为代表的在线社交平逡逑台多种多样
录了自上一次记录日志以来数据库所进行过的所有改动操作以及潜在但并未实逡逑际发生的改动操作。逡逑以时间版本构建的数据集合实例如图3-5和图3-6所示,其中,图3-5所示逡逑的是不同时间构建的全量数据集合
图3-12北邮人论坛用户发帖数分布情况逡逑其次,对论坛中主题帖自发布后收到的回复数随发布时间间隔的分布情况进逡逑行了统计,图3-13和图3-14分别展示了主题帖收到回复数随以小时为单位和以逡逑天为单位的发布时间间隔的分布情况:逡逑40000邋-1逦—?一邋回复数逡逑?逡逑30000邋-逡逑
本文编号:2795185
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09
【图文】:
2017年6月,我国网民规模达到7.51亿,互联网普及率为54.3%,其中手机网逡逑民规模达到7.24亿[1]。结合CNNIC发布的数据,最近几年的中国网民规模和互逡逑联网普及率变化情况如图1-1所示:逡逑截止2017.06中国网民规模和互联网普及率(单位??万人)逡逑80o0a逦逦邋...逦6C’.G0s逡逑75116逡逑73125逦r逡逑70958逦逦逡逑68826邋逦-'逡逑70000逦66769逦逦逡逑64875逦SO.OO%逡逑_逦一^一^逡逑灥逦一-逡逑一*一*40.004逡逑姦逡逑5..!逦W[:■逡逑曊WWWW_W曑,H曊逡逑40000逦3。0邋的逡逑m_'r逡逑30000逡逑20.0(fi>逡逑脚逡逑佊逡逑10000逡逑11逦㈥h逦_W丨?"逦D逦It:丨逡逑0逦0.00?,逡逑2012.06逦2012.12逦2013.06逦2013.12逦20K.06逦2014.12逦2015.06逦2015.12逦2016.06逦2016.12逦2017.06逡逑Bsaws人数——荮及涿逡逑图1-1中国网民规模和互联网普及率⑴逡逑正是在互联网不断普及和移动互联技术不断发展的形式下,基于Web2.邋0技逡逑术的在线社交网络也随之得到不断的发展,涌现出多种形式的在线社交应用,越逡逑来越多的网民参与到在线社交网络当中,在线社交网络也逐渐成为社会新闻发布、逡逑舆论传播、个性化内容发布的重要平台。目前以新媒体应用为代表的在线社交平逡逑台多种多样
录了自上一次记录日志以来数据库所进行过的所有改动操作以及潜在但并未实逡逑际发生的改动操作。逡逑以时间版本构建的数据集合实例如图3-5和图3-6所示,其中,图3-5所示逡逑的是不同时间构建的全量数据集合
图3-12北邮人论坛用户发帖数分布情况逡逑其次,对论坛中主题帖自发布后收到的回复数随发布时间间隔的分布情况进逡逑行了统计,图3-13和图3-14分别展示了主题帖收到回复数随以小时为单位和以逡逑天为单位的发布时间间隔的分布情况:逡逑40000邋-1逦—?一邋回复数逡逑?逡逑30000邋-逡逑
本文编号:2795185
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2795185.html