社交媒体突发事件检测及溯源分析研究
发布时间:2023-11-12 16:19
近年来,随着社交网络的不断普及,各种社交媒体层出不穷,微博作为目前交互性和实时性最强的主流社交媒体之一,为用户提供了自由发表言论和获取其他信息来源的平台,从而形成了海量数据。很多现实世界发生的突发事件在微博上被发布传播,微博上还没有形成完善的监管措施,突发事件在传播过程中会形成一些虚假信息、谣言等虚假言论,这类信息会污染网络环境,经过不断传播,放大了虚假言论对社会带来的不良影响。因此,对微博进行突发事件检测与溯源研究,可以及时了解社会舆情动态,同时也可以掌握事件源头,帮助政府等相关部门从源头上控制事件传播。由于微博含有不规范的文本,结构不统一,且数据量大,针对突发事件自身的突发性这一特点,本文提出了一种基于热点话题的微博突发事件检测方法,首先根据事件的突发性,根据前后两天的数据对突发词的值进行了计算,选择具有高突发值的词作为重点突发词,对这些重点突发词建立一个共现矩阵,通过共现矩阵可以计算出重点突发词的相异矩阵,然后在此基础上使用凝聚层次聚类算法得到热点话题,使用离散型朴素贝叶斯分类算法训练一个分类模型,使用这个模型对热点话题进行分类,由此检测出突发事件及类型。针对突发事件源头不一定就...
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 主要研究内容
1.4 论文组织架构
1.5 本章小结
第2章 相关理论及技术
2.1 数据获取及预处理
2.1.1 数据获取
2.1.2 文本预处理
2.2 文本表示模型
2.2.1 向量空间模型
2.2.2 共现矩阵
2.2.3 Word2Vec
2.3 文本聚类算法介绍
2.3.1 基于划分的聚类算法
2.3.2 基于层次的聚类算法
2.3.3 基于密度的聚类算法
2.4 贝叶斯分类
2.5 微博影响力分析
2.6 本章小结
第3章 基于热点话题的突发事件检测
3.1 突发事件定义
3.2 突发事件检测模型
3.2.1 词突发值计算
3.2.2 突发词聚类
3.2.3 突发事件及其类型的检测
3.3 实验及结果分析
3.3.1 实验环境
3.3.2 实验数据采集及预处理
3.3.3 评价指标
3.3.4 实验结果与分析
3.4 本章小结
第4章 基于微博影响力的突发事件溯源
4.1 突发事件溯源框架
4.2 微博影响力分析
4.2.1 用户影响力分析
4.2.2 事件影响力分析
4.2.3 影响力分析
4.3 实验及分析
4.3.1 数据准备
4.3.2 实验结果与分析
4.4 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
个人简历
硕士研究生期间发表论文情况
本文编号:3863508
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 主要研究内容
1.4 论文组织架构
1.5 本章小结
第2章 相关理论及技术
2.1 数据获取及预处理
2.1.1 数据获取
2.1.2 文本预处理
2.2 文本表示模型
2.2.1 向量空间模型
2.2.2 共现矩阵
2.2.3 Word2Vec
2.3 文本聚类算法介绍
2.3.1 基于划分的聚类算法
2.3.2 基于层次的聚类算法
2.3.3 基于密度的聚类算法
2.4 贝叶斯分类
2.5 微博影响力分析
2.6 本章小结
第3章 基于热点话题的突发事件检测
3.1 突发事件定义
3.2 突发事件检测模型
3.2.1 词突发值计算
3.2.2 突发词聚类
3.2.3 突发事件及其类型的检测
3.3 实验及结果分析
3.3.1 实验环境
3.3.2 实验数据采集及预处理
3.3.3 评价指标
3.3.4 实验结果与分析
3.4 本章小结
第4章 基于微博影响力的突发事件溯源
4.1 突发事件溯源框架
4.2 微博影响力分析
4.2.1 用户影响力分析
4.2.2 事件影响力分析
4.2.3 影响力分析
4.3 实验及分析
4.3.1 数据准备
4.3.2 实验结果与分析
4.4 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
个人简历
硕士研究生期间发表论文情况
本文编号:3863508
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3863508.html