当前位置:主页 > 科技论文 > 数学论文 >

基于影响力的社会网络关键用户识别方法研究

发布时间:2017-12-09 20:19

  本文关键词:基于影响力的社会网络关键用户识别方法研究


  更多相关文章: 关键用户识别 社会网络 用户影响力 HITS 线性阈值模型


【摘要】:社会网络是由用户和用户间的多种社会关系组成的,任何关于社会网络的研究都与社会网络用户有关。随着互联网技术的飞速发展,社会网络中的用户规模也随之变大,为关于社会网络的研究和研发带来了严重阻碍。识别出社会网络中的关键用户能够有效地解决用户规模庞大的问题,但是,目前的识别方法存在识别依据单一、准确度低、无法较为全面识别关键用户等缺陷。 目前识别社会网络中关键用户的方法比较少,并且大多数是以用户在社会网络中的拓扑结构为识别依据,通过中心性分析来识别关键用户。中心性分析是以中心性测度衡量的,其中一种分析方法为度中心性,该分析方法将社会网络用户抽象为结点,通过统计结点的邻接结点数目来计算该结点的度中心性测度,即该结点的度(在图论中,结点的度为与该结点具有关系的结点的总数)。在社会网络中,度值相对较大的结点,其重要程度也相对较高,结点对应的社会网络用户是关键用户的可能性也相对较大。这种识别方法的依据是社会网络中结点度的幂律分布——度值相对较大的结点数目只占社会网络所包含结点总数的很小一部分,度值相对较小的结点数目却占社会网络所包含结点总数的很大一部分,度值相对较大的结点自然比同一社会网络中度值相对较小的结点发挥着更有意义的作用,因而也具有更高的重要性。虽然该方法能够较为快速地识别出度特别大的关键用户,但是,对于度相对较小的关键用户该方法的识别准确率并不高。 本文方法更为充分地利用了社会网络用户具有的特征,通过聚簇算法将社会网络聚成多个社会网络子网,分别计算每个社会网络子网中用户的影响力,依据同一个社会网络子网中用户影响力的相对大小来识别关键用户。本文方法的核心是社会网络用户影响力的计算,用户影响力计算由四个部分组成:量化用户特征,活动用户的链接强度和影响力算法,计算非活动用户与活动用户之间的相似度,非活动用户影响力算法。这四个部分中,活动用户的链接强度和影响力算法,非活动用户影响力算法最为重要。活动用户的链接强度和影响力算法是以HITS算法为基础的,将网页替换为用户,以活动用户间的信任关系作为链接关系,以量化的用户特征替代网页邻接关系构建转移矩阵,因此,,HITS算法得到的链接权威度和内容权威度就对应了活动用户的链接强度和影响力。非活动用户影响力算法是以改进的线性阈值模型为基础的,改进后的线性阈值模型具有如下优点:避免了随机选取活动用户带来的误差;以活动用户与非活动用户的相似度替代随机阈值,更符合用户间相互影响的实际情况;综合考虑活动用户的链接强度和活动用户与非活动用户的相似度,给出更为细粒度的非活动用户影响力计算方法,使得到的非活动用户影响力更为准确。得到所有用户的影响力之后,将影响力与设定的影响力阈值相比较,大于影响力阈值的用户即为关键用户。 将本文方法和现有方法应用到实际社会网络Epinions上表明,本文的关键用户识别方法能够较好的识别出关键用户,在识别准确度、稳定性方面均取得了良好效果。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O157.5

【参考文献】

中国期刊全文数据库 前5条

1 张玉芳,毛嘉莉,熊忠阳;一种改进的K-means算法[J];计算机应用;2003年08期

2 李亮;朱庆华;;社会网络分析方法在合著分析中的实证研究[J];情报科学;2008年04期

3 朱庆华;李亮;;社会网络分析法及其在情报学中的应用[J];情报理论与实践;2008年02期

4 杨伟杰;戴汝为;崔霞;;一种基于信息检索技术的网络新闻影响力分析方法[J];软件学报;2009年09期

5 甘早斌;丁倩;李开;肖国强;;基于声誉的多维度信任计算算法[J];软件学报;2011年10期



本文编号:1271718

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1271718.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c9f49***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com