当前位置:主页 > 管理论文 > 领导决策论文 >

基于微博社区的意见领袖发现方法研究

发布时间:2021-01-11 19:09
  微博作为Web2.0时代具有代表性的社交网站,对于社交网络服务的发展产生了很大的影响。微博服务平台使得人与人之间极大地拉近了距离,为人们新的合作与沟通交流方式提供了可能。微博网络的逐渐形成过程中,网络结构也显示出稀疏性,社区结构的内部成员间往往具有很强的相关性与联系性,准确地划分出各个社区能够进一步改善微博服务质量。标签传播算法(Label Propagation Algorithm,简称LPA)是一个有着规则简单、时间复杂度低等优势的社区发现算法,但其节点的随机选择对于最终社区结构识别的稳定性造成了一定的影响,同时对于用户同时拥有多个标签的重叠社区是不适用的。因此,本文提出一种基于用户核心度的重叠社区标签传播算法(User Core Label Propagation Algorithm,简称UCLPA)用来发现主题社区,其思想建立在社交网络中核心-外围结构特征和多标签传播算法COPRA(Community Overlap Propagation Algorithm)基础上,在标签的初始化阶段和标签更新的优先度选择两个方面进行改进,针对微博用户同时拥有多个主题标签的特征,通过引入用户... 

【文章来源】:西华大学四川省

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

基于微博社区的意见领袖发现方法研究


微博用户关系图

图模型,文档


一个文档词项分布,即各个词项在这篇文档所占的比例。对一篇文章的生成看成是,用户首先以一定概率选择某个主题选择主题相关的词语。在依次重复这个过程之后,每次生成数目的词为止。生成一篇文档,那么在文档中每个词语出p ( )= P ( ) p( )主题词语 文档 词语 主题 主题 文档于等式左边矩阵的每个元素,其表示每篇文档中每个词词频示每个主题中每个单词的概率;对于文档主题矩阵,其表示概率。文档中词的生成过程从概率角度可以用如下公式表( ) ( ) ( ) ( ) ( ) ( ) ( )z zp w d p z p w z p z d p d p z d p w zd )是已知的,而 p ( w z )和 p ( z d )未知,假设有文档 D 篇,每一篇有 K 个,那么 p ( w z )是一个 D N的向量, p ( z d )是一个 D K矩阵。

标签,指节


西华大学硕士学位论文指节点 X 在第t 次迭代的标签结果,以它的邻居节点在第 ,公式如下:1( ) ( ( 1),.... ( 1))x x xkC t f C t C t ( )x t 指节点 x 在 t 时刻的标签, f 函数返回邻 x 居节点具有相签。一般情况下,如果有多个标签被最多的邻居节点使用,是,这种方法可能出现震荡现象,甚至如图 3.2,无限迭代

【参考文献】:
期刊论文
[1]一种基于节点影响力的局部社区发现算法[J]. 易秀双,韩业挺,王兴伟.  小型微型计算机系统. 2013(09)
[2]基于LDA模型的中文微博话题意见领袖挖掘[J]. 冯时,景珊,杨卓,王大玲.  东北大学学报(自然科学版). 2013(04)
[3]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,万怀宇School of Computer and Information Technology,Beijing Jiaotong University,田盛丰.  Journal of Computer Science & Technology. 2012(03)
[4]基于局部探测的快速复杂网络聚类算法[J]. 金弟,刘大有,杨博,刘杰,何东晓,田野.  电子学报. 2011(11)
[5]语言技术平台[J]. 刘挺,车万翔,李正华.  中文信息学报. 2011(06)



本文编号:2971318

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/2971318.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户61a41***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com