基于情感识别的案件舆情统计分析
发布时间:2023-01-08 15:38
突发和争议案件容易激发公众的好奇心,引起社会公众的关注.公众关注的同时就会形成诸多的网络舆情,公众的愤慨、焦虑等负面情绪也容易随之扩散、爆发.随着社交网络的成熟,微博成为信息的载体.微博用户发表的信息包含不同的情感特征,挖掘这些特征对于舆情预警、公众情绪引导、案件网络管控等有重要的意义.本文主要以李心草溺亡案件为例,基于微博数据进行案件的情感分析和舆情分析.在案件的情感分析方面,首先采用爬虫技术爬取微博上相关案件的新闻、用户评论内容及用户信息等数据.其次是对爬取的数据进行预处理,将与本文研究内容无关的杂乱数据删除.然后使用现有分词工具进行分词,去停用词等操作,在此基础上进行案件关键词的提取,最后建立词向量模型,采用支持向量机和长短时记忆网络(Long Short-Term Memory)算法对公众的情感倾向进行建模训练,通过查准率、召回率、AUC(Area Under the Curve)等分类评价指标进行比较发现,LSTM算法较支持向量机算法有较大的提升,能够达到预测公众情感倾向的目的;在案件的舆情分析方面,主要从舆情传播途径走势、评论用户信息、评论内容等角度对案件进行统计分析,总结...
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第1章 绪论
1.1 研究背景与研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状及发展趋势
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 论文结构及研究方法
1.3.1 研究方法
1.3.2 论文结构
第2章 相关理论与技术
2.1 网络爬虫技术
2.1.1 网络爬虫框架介绍
2.1.2 网络爬虫技术介绍
2.2 文本特征提取和关键词提取技术
2.2.1 Word2Vec词向量模型的工作原理
2.2.2 基于TF-IDF的关键词提取技术
2.3 基于机器学习的文本分类模型
2.3.1 支持向量机模型原理
2.3.2 递归神经网络模型原理
2.3.3 长短期记忆网络模型原理
2.4 文本处理技术
2.4.1 分词处理方法
2.4.2 停用词处理
2.4.3 数据增强技术
第3章 基于机器学习的微博情感分析
3.1 微博情感的特征提取
3.1.1 微博情感文本预处理
3.1.2 基于Word2vec的微博文本特征提取
3.2 基于微博情感文本的情感分类模型
3.2.1 构建基于支持向量机的微博情感分类模型
3.2.2 构建基于LSTM的微博情感分类模型
3.3 情感分类模型流程与评价指标
第4章 李心草溺亡案件分析
4.1 案件背景及过程介绍
4.2 案件情感分析
4.2.1 数据集准备
4.2.2 数据预处理
4.2.3 关键词提取结果
4.2.4 基于模型的案件情感分析
4.3 案件舆情分析
4.3.1 传播过程分析
4.3.2 微博评论博主信息分析
4.3.3 评论内容分析
总结与展望
参考文献
致谢
【参考文献】:
期刊论文
[1]中文文献引文情感语料库构建[J]. 徐琳宏,丁堃,陈娜,李冰. 情报学报. 2020(01)
[2]CNNIC发布第44次《中国互联网络发展状况统计报告》[J]. 于朝晖. 网信军民融合. 2019(09)
[3]基于文本情感分析的文化综艺节目综合评价——以央视文化类综艺节目《国家宝藏》为例[J]. 周娜,何润奇. 中南民族大学学报(人文社会科学版). 2019(05)
[4]基于微博的细粒度情感分析[J]. 敦欣卉,张云秋,杨铠西. 数据分析与知识发现. 2017(07)
[5]在线中文用户评论研究综述:基于情感计算的视角[J]. 吴应良,黄媛,王选飞. 情报科学. 2017(06)
[6]一种基于改进的TF-IDF和支持向量机的中文文本分类研究[J]. 郭太勇. 软件. 2016(12)
[7]Mining microblog user interests based on TextRank with TF-IDF factor[J]. Tu Shouzhong,Huang Minlie. The Journal of China Universities of Posts and Telecommunications. 2016(05)
[8]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春. 计算机科学. 2016(06)
[9]基于字符串匹配的中文分词算法的研究[J]. 常建秋,沈炜. 工业控制计算机. 2016(02)
[10]一种基于类别不平衡数据的层次分类模型[J]. 施培蓓,刘贵全,汪中,卫兵. 中国科学技术大学学报. 2015(01)
硕士论文
[1]基于深度学习的微博短文本情感倾向分析[D]. 李维森.湘潭大学 2019
[2]危机传播视角下事故灾难事件微博舆情引导研究[D]. 乔田.长春工业大学 2019
[3]基于分类模型的电商用户复购行为预测研究[D]. 杜世民.杭州师范大学 2019
[4]基于深度学习的用户评论情感分析[D]. 郑爽.重庆邮电大学 2019
[5]政法系统突发事件网络舆情应对机制研究[D]. 贾佳辖.中央民族大学 2019
[6]基于生成对抗网络的中文语言模型数据增强技术[D]. 赵鹏飞.哈尔滨工业大学 2018
[7]基于Selenium的一种Web自动化测试系统的设计与实现[D]. 张竞帆.北京交通大学 2017
[8]基于统计方法的中文文本分类[D]. 殷越.华中师范大学 2017
[9]基于Scrapy的分布式网络新闻抓取系统设计与实现[D]. 马联帅.西安电子科技大学 2015
[10]基于文本数据挖掘的微博情感分析与监控系统[D]. 缪茹一.浙江工业大学 2015
本文编号:3728731
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第1章 绪论
1.1 研究背景与研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状及发展趋势
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 论文结构及研究方法
1.3.1 研究方法
1.3.2 论文结构
第2章 相关理论与技术
2.1 网络爬虫技术
2.1.1 网络爬虫框架介绍
2.1.2 网络爬虫技术介绍
2.2 文本特征提取和关键词提取技术
2.2.1 Word2Vec词向量模型的工作原理
2.2.2 基于TF-IDF的关键词提取技术
2.3 基于机器学习的文本分类模型
2.3.1 支持向量机模型原理
2.3.2 递归神经网络模型原理
2.3.3 长短期记忆网络模型原理
2.4 文本处理技术
2.4.1 分词处理方法
2.4.2 停用词处理
2.4.3 数据增强技术
第3章 基于机器学习的微博情感分析
3.1 微博情感的特征提取
3.1.1 微博情感文本预处理
3.1.2 基于Word2vec的微博文本特征提取
3.2 基于微博情感文本的情感分类模型
3.2.1 构建基于支持向量机的微博情感分类模型
3.2.2 构建基于LSTM的微博情感分类模型
3.3 情感分类模型流程与评价指标
第4章 李心草溺亡案件分析
4.1 案件背景及过程介绍
4.2 案件情感分析
4.2.1 数据集准备
4.2.2 数据预处理
4.2.3 关键词提取结果
4.2.4 基于模型的案件情感分析
4.3 案件舆情分析
4.3.1 传播过程分析
4.3.2 微博评论博主信息分析
4.3.3 评论内容分析
总结与展望
参考文献
致谢
【参考文献】:
期刊论文
[1]中文文献引文情感语料库构建[J]. 徐琳宏,丁堃,陈娜,李冰. 情报学报. 2020(01)
[2]CNNIC发布第44次《中国互联网络发展状况统计报告》[J]. 于朝晖. 网信军民融合. 2019(09)
[3]基于文本情感分析的文化综艺节目综合评价——以央视文化类综艺节目《国家宝藏》为例[J]. 周娜,何润奇. 中南民族大学学报(人文社会科学版). 2019(05)
[4]基于微博的细粒度情感分析[J]. 敦欣卉,张云秋,杨铠西. 数据分析与知识发现. 2017(07)
[5]在线中文用户评论研究综述:基于情感计算的视角[J]. 吴应良,黄媛,王选飞. 情报科学. 2017(06)
[6]一种基于改进的TF-IDF和支持向量机的中文文本分类研究[J]. 郭太勇. 软件. 2016(12)
[7]Mining microblog user interests based on TextRank with TF-IDF factor[J]. Tu Shouzhong,Huang Minlie. The Journal of China Universities of Posts and Telecommunications. 2016(05)
[8]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春. 计算机科学. 2016(06)
[9]基于字符串匹配的中文分词算法的研究[J]. 常建秋,沈炜. 工业控制计算机. 2016(02)
[10]一种基于类别不平衡数据的层次分类模型[J]. 施培蓓,刘贵全,汪中,卫兵. 中国科学技术大学学报. 2015(01)
硕士论文
[1]基于深度学习的微博短文本情感倾向分析[D]. 李维森.湘潭大学 2019
[2]危机传播视角下事故灾难事件微博舆情引导研究[D]. 乔田.长春工业大学 2019
[3]基于分类模型的电商用户复购行为预测研究[D]. 杜世民.杭州师范大学 2019
[4]基于深度学习的用户评论情感分析[D]. 郑爽.重庆邮电大学 2019
[5]政法系统突发事件网络舆情应对机制研究[D]. 贾佳辖.中央民族大学 2019
[6]基于生成对抗网络的中文语言模型数据增强技术[D]. 赵鹏飞.哈尔滨工业大学 2018
[7]基于Selenium的一种Web自动化测试系统的设计与实现[D]. 张竞帆.北京交通大学 2017
[8]基于统计方法的中文文本分类[D]. 殷越.华中师范大学 2017
[9]基于Scrapy的分布式网络新闻抓取系统设计与实现[D]. 马联帅.西安电子科技大学 2015
[10]基于文本数据挖掘的微博情感分析与监控系统[D]. 缪茹一.浙江工业大学 2015
本文编号:3728731
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3728731.html