基于动态主题模型融合多维数据的微博社区发现算法
本文选题:新浪微博 + 文本挖掘 ; 参考:《软件学报》2017年02期
【摘要】:随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博网络映射为有向加权网络,网络中边的方向反映节点之间的关注关系,利用所提出的DTM(dynamic topic model)计算出节点之间的语义相似度,并将其作为节点间连边的权重.DTM是一种微博主题模型.该模型不仅能够挖掘博客的主题分布,而且能够计算出某一主题中用户的影响力大小.其次,利用所提出的复杂度较低的标签传播算法WLPA(weighted lebel propagation)进行微博网络的社区发现.该算法的初始化阶段将影响力大的用户节点作为初始节点,标签按照节点的影响力从大到小进行传播,避免了传统标签传播算法逆流现象的发生,提高了标签传播算法的稳定性.真实数据上的实验结果表明,DTM模型能够很好地对微博进行主题挖掘,DC-DTM算法能够有效地挖掘出微博网络的社区.
[Abstract]:With the increasing of Weibo users, Weibo network has become a platform for users to exchange information. Because of the limited length of blog posts, the traditional community discovery algorithm can not effectively solve the problem of Weibo network sparsity and so on. A DC-DTM (discovery community by dynamic topic model) algorithm .DC-DTM algorithm is proposed to map the Weibo network to a directed weighted network. The direction of edges in the network reflects the relationship of concern between nodes, and the semantic similarity between nodes is calculated by using the proposed DTM (dynamic topic model), which is regarded as the weight of the connected edges between nodes. DTM is a kind of Weibo topic model. The model not only can mine the distribution of blog topics, but also can calculate the influence of users in a certain topic. Secondly, the proposed tag propagation algorithm WLPA (weighted lebel propagation) is used for community discovery in Weibo networks. In the initialization phase of the algorithm, the influential user nodes are taken as the initial nodes, and the labels are propagated according to the influence of the nodes from large to small, thus avoiding the reverse flow phenomenon of the traditional label propagation algorithm. The stability of label propagation algorithm is improved. The experimental results on real data show that the DTM model can effectively mine the community of Weibo network by using DC-DTM algorithm.
【作者单位】: 东北大学计算机科学与工程学院;东北大学软件学院;
【分类号】:TP181
【相似文献】
相关会议论文 前10条
1 何敏;陈中显;梅松涛;;蚁群算法的研究与进展[A];中国计量协会冶金分会2010年会论文集[C];2010年
2 高玮;;免疫连续蚁群算法[A];第二十六届中国控制会议论文集[C];2007年
3 唐乾玉;韩曾晋;;基于扰动分析的优化算法[A];1994中国控制与决策学术年会论文集[C];1994年
4 金成勋;周广禄;郭恒业;;对ICP算法中稳定采样的研究[A];立体图象技术及其应用研讨会论文集[C];2005年
5 陈元琰;闫友彪;罗晓曙;;REM算法的改进[A];广西计算机学会2005年学术年会论文集[C];2005年
6 范瑛;;改进蚁群算法结合BP网络用于入侵检测[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
7 万丽芬;钟炎平;;约束LMS算法研究[A];第二十届电工理论学术年会论文集[C];2008年
8 云飞;薛青;姚义军;;改进型LMBP算法在军事数据分析中的应用研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
9 朱双东;艾智斌;阎夏;;BP网络学习算法的改进方案探析[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
10 唐乾玉;陈翰馥;韩曾晋;;串行生产线的参数优化[A];1994年中国控制会议论文集[C];1994年
相关博士学位论文 前10条
1 杨扩军;TIADC系统校准算法研究与实现[D];电子科技大学;2015年
2 黄亚魁;几类优化问题的BB型算法研究[D];西安电子科技大学;2015年
3 王戈;通信信号若干联合处理技术研究[D];解放军信息工程大学;2013年
4 易雯帆;非线性偏微分方程多解计算大范围收敛算法及其应用研究[D];湖南师范大学;2016年
5 蔡永智;分布式电力系统状态估计研究[D];华南理工大学;2016年
6 苏雪平;基于交叉多模信息的新闻图像人物标识算法[D];西北工业大学;2015年
7 谢侃;稀疏盲分离的理论与算法研究[D];广东工业大学;2016年
8 王可心;大规模过程系统非线性优化的简约空间理论与算法研究[D];浙江大学;2008年
9 鲍吉锋;平衡问题和优化问题若干算法的收敛性分析[D];浙江大学;2013年
10 韩飞;基于先验信息编码的约束学习算法研究[D];中国科学技术大学;2006年
相关硕士学位论文 前10条
1 杨展;城轨列车自动调整系统模型与算法研究[D];西南交通大学;2015年
2 马英钧;基于人工蜂群算法的约束优化问题研究[D];华中师范大学;2015年
3 钱其;电网谐波和间谐波功率的计量算法研究[D];中国科学技术大学;2015年
4 蒋玉冰;无线通信信号到达角跟踪算法研究[D];电子科技大学;2014年
5 孙方亮;基于粒子群与中心引力的一种新混合算法及应用[D];西安电子科技大学;2014年
6 于诗杰;基于无波前探测的大气光通信自适应补偿方法研究[D];西安电子科技大学;2014年
7 柯家龙;压缩感知算法及其在成像中的应用[D];南京邮电大学;2015年
8 刘光泓;并行磁共振图像全变分恢复一阶算法研究[D];南京邮电大学;2015年
9 张德祥;基于改进蚁群算法的机器人三维路径规划研究[D];青岛科技大学;2015年
10 张申利;基于蜂群算法的GIS优化选址及其并行化研究与应用[D];中国石油大学(华东);2014年
,本文编号:2058806
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2058806.html