微博中话题的传播模型及热点预测
发布时间:2017-10-09 11:24
本文关键词:微博中话题的传播模型及热点预测
【摘要】:微博作为新兴的网络社交平台,因其信息流通速度快、信息内容丰富、人群覆盖面广吸引了大量用户的加入,这使得微博在舆论传播中的作用日益凸显。有很多微博是围绕同一相关事件而展开讨论的,这便构成了一个话题。研究话题的传播规律并对热点话题进行有效预测,有助于我们了解事件的发展动态及趋势,可用于新闻热点的挖掘和不良信息的监管等领域。 本文介绍了微博中话题的传播模型及完整的热点预测系统流程,包括数据的获取及预处理、话题聚类和热点话题预测模块。 论文的主要工作有: 1.由于微博中包含大量的广告、商家促销、活动宣传等无意义信息,本文提出了一种从用户和微博两个角度构建微博特征向量的方法,通过支持向量机(Support Vector Machine, SVM)实现了信息的有效过滤; 2.论文将话题传播过程划分为三个阶段(即潜伏期、爆发期与消退期),统计各个时期用户特征项及微博特征项的变化规律,并采用VIP用户比例、用户粉丝数分布、#话题标签和url外链比例四个特征刻画话题传播,取得了较好的实验结果; 3.论文采用了基于“潜在基底”假设的分类模型,并提出了时序信号表示话题趋势的方法,最后对话题进行热点预测和参数分析。实验结果表明83.5%的话题可以提前预测,平均提前时间约为1.6小时,验证了算法的有效性。
【关键词】:微博过滤 微博话题 分类模型 热点预测
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 绪论9-14
- 1.1 本文研究的背景及意义9-10
- 1.2 国内外研究现状10-12
- 1.2.1 微博内容过滤技术的研究现状10-11
- 1.2.2 话题的传播分析及热点预测研究现状11-12
- 1.3 本文的主要研究工作12
- 1.4 论文的内容安排12-14
- 第二章 微博数据的准备及预处理14-26
- 2.1 微博数据的爬取14-16
- 2.2 垃圾信息的过滤16-23
- 2.2.1 微博特征16-18
- 2.2.2 文本内容的向量化18-20
- 2.2.3 过滤算法的实现20-22
- 2.2.4 实验效果评估22-23
- 2.3 微博话题的聚类23-25
- 2.3.1 LDA模型建模23-24
- 2.3.2 话题聚类24-25
- 2.4 本章小结25-26
- 第三章 话题的传播分析与分类模型26-48
- 3.1 话题的传播分析26-40
- 3.1.1 话题传播阶段的划分27-31
- 3.1.2 话题传播中的用户分析31-36
- 3.1.3 话题传播中的微博分析36-40
- 3.2 分类模型40-47
- 3.2.1 分类的思想40-41
- 3.2.2 随机模型41
- 3.2.3 类别检测41-45
- 3.2.4 算法的实现45-47
- 3.3 本章小结47-48
- 第四章 话题的热点预测48-66
- 4.1 话题趋势特征的构建48-54
- 4.1.1 微博变化率48-49
- 4.1.2 数据规范化49-51
- 4.1.3 话题信号峰值处理51-53
- 4.1.4 话题信号对数处理53-54
- 4.2 在线话题距离的计算54-56
- 4.3 实验结果及分析56-64
- 4.3.1 算法的测试及参数分析57-60
- 4.3.2 案例分析60-64
- 4.4 本章小结64-66
- 第五章 总结与展望66-68
- 5.1 论文主要工作66-67
- 5.2 工作展望67-68
- 参考文献68-71
- 致谢71-72
- 攻读学位期间发表或已录用的学术论文72
【参考文献】
中国期刊全文数据库 前5条
1 李学明;李海瑞;薛亮;何光军;;基于信息增益与信息熵的TFIDF算法[J];计算机工程;2012年08期
2 马社祥,刘贵忠,曾召华;基于小波分析的非平稳时间序列分析与预测[J];系统工程学报;2000年04期
3 兰月新;;突发事件网络衍生舆情监测模型研究[J];现代图书情报技术;2013年03期
4 韩忠明;张慧;张梦;;基于内容的热点话题传播模型[J];智能系统学报;2013年03期
5 王昊;李义萍;冯卓楠;冯铃;;流行病模型在微博转发预测中的应用(英文)[J];中国通信;2013年03期
,本文编号:999914
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/999914.html