“新冠”疫情初期基于微博的情感分析
发布时间:2023-04-12 01:10
本文的研究内容是基于微博短文本的情感分析。情感分析属于自然语言处理中文本分类的一个重要方向。本文数据来自于Data Fountain平台采集的新浪微博关于“新冠肺炎”主题的微博10w条文本数据,经过人工标注文本情感倾向为消极、积极和中立。实证部分分别采用了词典情感分析法和机器学习分析法,采用的算法分别有基于TFIDF的支持向量机和朴素贝叶斯两种以及基于wod2vec的支持向量机和LSTM,并将五种结果进行对比,结合统计分析方法以及事件的发展对疫情初期的网络反应进行舆情分析。首先,本文基于情绪词典计算文本情感得分。然后,使用了传统文本表示和特征选择方法TFIDF(逆文本文档)以及传统机器学习算法支持向量机和朴素贝叶斯进行文本分类,由于维度爆炸导致的向量稀疏,分类效果很不理想。因此,后面使用word2vec算法训练的词向量和文档向量来进行文本表示,分类结果得到较大的提升;在此之后,使用神经网络中的LSTM对该文本数据集进行分类,并且对以上各种方式实现的结果使用统计指标进行评估。本文首次使用机器学习算法结合统计分析对时事进行实时地舆情分析,该方向对于国家政策出台以及实施都会有重要意义。
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 文本情感分析目的和意义
1.3 文本情感分析的研究方法
1.4 国内外发展现状
1.5 研究结论分析
2 理论基础
2.1 文本情感分析基本概念
2.2 情感分析涉及的主要技术及方法
2.3 情感分析的评价体系
3 论证过程
3.1 获取预处理
3.2 中文分词
3.3 数据集与实验环境
3.4 实验结果
4 研究结论与分析报告
4.1 实验结论
4.2 舆情分析报告
5 研究不足与展望
5.1 研究不足
5.2 研究展望
致谢
参考文献
附件
本文编号:3790121
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 文本情感分析目的和意义
1.3 文本情感分析的研究方法
1.4 国内外发展现状
1.5 研究结论分析
2 理论基础
2.1 文本情感分析基本概念
2.2 情感分析涉及的主要技术及方法
2.3 情感分析的评价体系
3 论证过程
3.1 获取预处理
3.2 中文分词
3.3 数据集与实验环境
3.4 实验结果
4 研究结论与分析报告
4.1 实验结论
4.2 舆情分析报告
5 研究不足与展望
5.1 研究不足
5.2 研究展望
致谢
参考文献
附件
本文编号:3790121
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3790121.html