基于语义和图挖掘的社交网络分析
发布时间:2017-04-30 19:04
本文关键词:基于语义和图挖掘的社交网络分析,由笔耕文化传播整理发布。
【摘要】:随着互联网的发展,活跃在社交网络中的人与主题越来越多,而海量的用户生成内容对信息的获取与检索提出了挑战。其中,社交网络中突然产生的主题(突发主题,Bursty Topic),由于往往对应着特殊的事件并表征社会对突发事件的舆情,对其进行探测成为一个很有价值的研究热点。近年来,相关的研究工作分别从信息流、主题模型以及传播模型等各个方面展开了研究,但是仍然存在以下问题:1、对突发主题缺少数学上的明确定义。2、对突发主题的研究多集中在新闻和学术界,对于社交网络中突发主题所具有的社交属性考虑不足。针对此背景,本文从图挖掘与语义分析的相关理论结合出发,旨在进一步探索解决突发主题检测问题的解决方案。 首先,针对突发主题的数学表达问题。本文在主题模型相似性的基础上,提出了一种突发主题的数学模型:基于JS距离的突发主题模型。并给出了两种求解算法:基于随机游走的区域探测算法,以及基于时间分布的区域切割算法。在单服务器开销限制下,实验证明能有效解决大规模社交网络数据的突发主题提取问题。同时,对所提算法覆盖度、时间复杂度进行了测试和评估。 然后,针对突发主题社交属性研究不足的问题。本文对前人工作中提出的基于主题模型和马尔科夫过程的突发探测模型进行了改进。考虑到在社交网络中文档作者对突发主题产生的影响,在马尔科夫过程的转移概率中加入了社交影响力参数,提出了基于社交影响力和主题模型的突发探测模型。在同经典模型对比实验中,新的模型对于突发话题的探测具有更高的准确性。
【关键词】:突发主题 主题模型 社交影响力 社交网络
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.09
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 绪论8-18
- 1.1 主题模型相关研究9-13
- 1.1.1 LDA模型的产生10-11
- 1.1.1.1 潜在语义分析模型LSA10
- 1.1.1.2 概率潜在语义分析模型PLSA10
- 1.1.1.3 隐含狄利克雷分布模型LDA10-11
- 1.1.2 LDA模型的改进研究11-12
- 1.1.3 LDA模型的应用研究12-13
- 1.2 突发主题检测的相关研究13-14
- 1.3 基于社交关系的主题发现研究14-15
- 1.4 本文的主要工作和创新点15
- 1.5 论文结构安排15-18
- 第二章 面向突发主题检测的动态主题模型相关研究18-28
- 2.1 隐含狄利克雷分布模型LDA18-24
- 2.1.1 LDA模型的参数推导19-20
- 2.1.2 LDA模型求解20-24
- 2.2 动态结构的主题模型24-26
- 2.2.1 动态主题模型DTM24-25
- 2.2.2 时变主题模型TOT25
- 2.2.3 两种模型的对比25-26
- 2.3 主题模型评估方法26
- 2.4 主题模型与突发主题提取26-27
- 2.5 本章小结27-28
- 第三章 基于LDA生成概率矩阵的突发主题研究28-38
- 3.1 LDA在实验数据上的表现28-31
- 3.1.1 实验数据集28-29
- 3.1.2 实验数据处理流程29
- 3.1.3 LDA的主题计算结果29-31
- 3.2 LDA与突发主题提取31-32
- 3.2.1 主题模型中的相似度31-32
- 3.2.2 基于JS距离的突发主题定义32
- 3.3 突发主题提取算法32-36
- 3.3.1 基于随机游走的区域探测算法32-34
- 3.3.2 基于时间分布的区域切割算法34-36
- 3.4 实验参数敏感度分析36-37
- 3.5 本章小结37-38
- 第四章 基于主题模型和图挖掘的突发主题研究38-46
- 4.1 基于主题模型和马尔科夫过程的突发主题探测模型38-39
- 4.2 基于社交影响力的突发主题探测模型39-44
- 4.2.1 社交网络节点影响力的度量方法39-40
- 4.2.2 模型构建40-41
- 4.2.3 实验结果41-44
- 4.3 实验参数敏感度分析44
- 4.4 本章小结44-46
- 第五章 总结与展望46-48
- 5.1 本文工作总结46
- 5.2 未来工作展望46-48
- 参考文献48-54
- 致谢54-56
- 作者攻读学位期间发表的学术论文目录56
【参考文献】
中国期刊全文数据库 前3条
1 陈宏;陈伟;;基于突发特征分析的事件检测[J];计算机应用研究;2011年01期
2 ;Online detection of bursty events and their evolution in news streams[J];Journal of Zhejiang University-Science C(Computer & Electronics);2010年05期
3 张虹;赵兵;钟华;;基于小波多尺度的网络论坛话题热度趋势预测[J];计算机技术与发展;2009年04期
本文关键词:基于语义和图挖掘的社交网络分析,,由笔耕文化传播整理发布。
本文编号:337399
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/337399.html