基于社交媒体的突发话题检测与演化分析方法研究
发布时间:2023-01-09 13:01
随着网络技术的迅速发展,社交媒体成为网民彼此交流和获取信息的主要工具和渠道。微博是当前最受欢迎的社交媒体之一,拥有庞大的网络用户,微博信息发布迅速、便捷且实时,往往成为突发话题的第一发布现场。因此如何从海量的微博数据流中快速而准确地检测到突发话题并对其进行演化分析具有重要的意义,不仅可以帮助用户把握突发话题的发展态势,而且可以为相关部门提供应急措施,为舆情分析提供理论支撑。本文以微博文本流为研究对象,旨在构建微博突发话题检测与演化分析框架,针对该框架所涉及的突发话题检测、突发话题演化分析的相关算法进行了系统的研究。本文的主要研究工作如下:(1)突发话题检测与演化问题分析。首先介绍了相关概念;然后提出目前微博突发话题检测与演化分析方法面临的挑战,并构建了微博突发话题检测与演化分析框架;最后分析了微博数据的特点,并对数据的预处理进行了介绍。(2)提出了一种基于动态窗口的微博突发话题检测方法。该方法将词对加速度作为突发特征,根据微博文本流中突发词对出现的速度自适应地确定突发话题窗口范围,并利用改进的非负矩阵分解聚类方法获取突发话题窗口中微博的主题结构。实验结果表明,该方法不但可以降低突发话题...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 突发话题检测研究
1.2.2 突发话题演化分析研究
1.3 主要研究内容
1.4 本文组织结构
第二章 问题分析及数据集
2.1 突发话题检测与演化问题分析
2.1.1 相关概念
2.1.2 突发话题检测问题分析
2.1.3 突发话题演化问题分析
2.1.4 本文研究方法框架
2.2 微博数据特点
2.3 微博数据预处理
2.3.1 无用信息过滤
2.3.2 分词及词性过滤
2.4 问题的形式化定义
2.5 本章小结
第三章 基于动态窗口的微博突发话题检测方法
3.1 突发特征和突发话题窗口
3.2 突发话题检测
3.2.1 突发话题检测框架
3.2.2 词对速度表
3.2.3 突发话题检测算法
3.3 实验结果与分析
3.3.1 测试环境与实验数据
3.3.2 P、R和 F1 值对比实验
3.3.3 DW-BTD算法的实时性
3.3.4 动态窗口的性能评价
3.3.5 突发话题的主题结构
3.3.6 参数对突发话题检测P、R和 F1 的影响
3.4 本章小结
第四章 基于极值点的微博突发话题演化分析方法
4.1 突发话题速度和加速度
4.2 演化时间窗口划分
4.3 突发话题演化分析
4.3.1 突发话题演化分析框架
4.3.2 突发话题演化分析算法
4.4 实验结果与分析
4.4.1 实验数据及参数设置
4.4.2 P、R和 F1 值对比实验
4.4.3 突发话题演化分析结果
4.4.4时间窗口对比实验
4.5 本章小结
第五章 结论与展望
5.1 结论
5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
【参考文献】:
期刊论文
[1]中文微博数据预处理常用方法研究[J]. 李楚贞,余育文. 科技经济导刊. 2019(33)
[2]基于熵理论的突发事件舆情演化研究[J]. 曾子明,方正东. 情报科学. 2019(09)
[3]基于增量式鲁棒非负矩阵分解的短文本在线聚类[J]. 贺超波,汤庸,张琼,刘双印,刘海. 电子学报. 2019(05)
[4]基于词向量和BTM的短文本话题演化分析[J]. 张佩瑶,刘东苏. 数据分析与知识发现. 2019(03)
[5]基于话题词共现网的话题演化方法[J]. 朱波,张洋. 辽宁工程技术大学学报(社会科学版). 2017(06)
[6]面向时间序列的微博话题演化模型研究[J]. 王振飞,刘凯莉,郑志蕴,王飞. 计算机科学. 2017(08)
[7]基于用户行为影响的微博突发话题检测方法[J]. 万越,隋杰. 中国科学技术大学学报. 2017(04)
[8]中文微博文本采集与预处理综述[J]. 孔雪娜,孙红. 软件导刊. 2017(02)
[9]网络舆情事件的话题演化分析——以成都女司机为例[J]. 陈福集,马梅兰. 情报杂志. 2016(05)
[10]基于时间序列分析的微博突发话题检测方法[J]. 贺敏,徐杰,杜攀,程学旗,王丽宏. 通信学报. 2016(03)
博士论文
[1]以事件为中心的网络舆情演化研究[D]. 翟羽佳.南开大学 2017
硕士论文
[1]面向舆情监控的微博热点话题发现及演化分析研究[D]. 党燕.内蒙古工业大学 2018
[2]基于高效用模式挖掘的微博文本突发话题检测方法研究[D]. 欧阳双.武汉大学 2018
[3]基于多特征融合的微博突发事件检测方法研究[D]. 王建.北京信息科技大学 2018
[4]基于话题模型的微博热点话题演化分析[D]. 颜月明.西安电子科技大学 2017
[5]基于维基语义聚类的微博舆情主题演化模型研究[D]. 王中勤.武汉大学 2017
[6]微博话题检测与跟踪方法研究[D]. 刘均峰.华中科技大学 2016
[7]突发事件微博新话题检测与跟踪系统的设计与实现[D]. 葛高飞.北京邮电大学 2014
本文编号:3729229
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 突发话题检测研究
1.2.2 突发话题演化分析研究
1.3 主要研究内容
1.4 本文组织结构
第二章 问题分析及数据集
2.1 突发话题检测与演化问题分析
2.1.1 相关概念
2.1.2 突发话题检测问题分析
2.1.3 突发话题演化问题分析
2.1.4 本文研究方法框架
2.2 微博数据特点
2.3 微博数据预处理
2.3.1 无用信息过滤
2.3.2 分词及词性过滤
2.4 问题的形式化定义
2.5 本章小结
第三章 基于动态窗口的微博突发话题检测方法
3.1 突发特征和突发话题窗口
3.2 突发话题检测
3.2.1 突发话题检测框架
3.2.2 词对速度表
3.2.3 突发话题检测算法
3.3 实验结果与分析
3.3.1 测试环境与实验数据
3.3.2 P、R和 F1 值对比实验
3.3.3 DW-BTD算法的实时性
3.3.4 动态窗口的性能评价
3.3.5 突发话题的主题结构
3.3.6 参数对突发话题检测P、R和 F1 的影响
3.4 本章小结
第四章 基于极值点的微博突发话题演化分析方法
4.1 突发话题速度和加速度
4.2 演化时间窗口划分
4.3 突发话题演化分析
4.3.1 突发话题演化分析框架
4.3.2 突发话题演化分析算法
4.4 实验结果与分析
4.4.1 实验数据及参数设置
4.4.2 P、R和 F1 值对比实验
4.4.3 突发话题演化分析结果
4.4.4时间窗口对比实验
4.5 本章小结
第五章 结论与展望
5.1 结论
5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
【参考文献】:
期刊论文
[1]中文微博数据预处理常用方法研究[J]. 李楚贞,余育文. 科技经济导刊. 2019(33)
[2]基于熵理论的突发事件舆情演化研究[J]. 曾子明,方正东. 情报科学. 2019(09)
[3]基于增量式鲁棒非负矩阵分解的短文本在线聚类[J]. 贺超波,汤庸,张琼,刘双印,刘海. 电子学报. 2019(05)
[4]基于词向量和BTM的短文本话题演化分析[J]. 张佩瑶,刘东苏. 数据分析与知识发现. 2019(03)
[5]基于话题词共现网的话题演化方法[J]. 朱波,张洋. 辽宁工程技术大学学报(社会科学版). 2017(06)
[6]面向时间序列的微博话题演化模型研究[J]. 王振飞,刘凯莉,郑志蕴,王飞. 计算机科学. 2017(08)
[7]基于用户行为影响的微博突发话题检测方法[J]. 万越,隋杰. 中国科学技术大学学报. 2017(04)
[8]中文微博文本采集与预处理综述[J]. 孔雪娜,孙红. 软件导刊. 2017(02)
[9]网络舆情事件的话题演化分析——以成都女司机为例[J]. 陈福集,马梅兰. 情报杂志. 2016(05)
[10]基于时间序列分析的微博突发话题检测方法[J]. 贺敏,徐杰,杜攀,程学旗,王丽宏. 通信学报. 2016(03)
博士论文
[1]以事件为中心的网络舆情演化研究[D]. 翟羽佳.南开大学 2017
硕士论文
[1]面向舆情监控的微博热点话题发现及演化分析研究[D]. 党燕.内蒙古工业大学 2018
[2]基于高效用模式挖掘的微博文本突发话题检测方法研究[D]. 欧阳双.武汉大学 2018
[3]基于多特征融合的微博突发事件检测方法研究[D]. 王建.北京信息科技大学 2018
[4]基于话题模型的微博热点话题演化分析[D]. 颜月明.西安电子科技大学 2017
[5]基于维基语义聚类的微博舆情主题演化模型研究[D]. 王中勤.武汉大学 2017
[6]微博话题检测与跟踪方法研究[D]. 刘均峰.华中科技大学 2016
[7]突发事件微博新话题检测与跟踪系统的设计与实现[D]. 葛高飞.北京邮电大学 2014
本文编号:3729229
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3729229.html