基于机器学习的网络舆情文本情感分类方法研究
发布时间:2021-07-17 09:32
文本情感分析是自然语言处理领域的主要研究方向之一,其主要研究围绕着词向量表示、文本特征提取、模型的建立等展开。而随着互联网对人们生活影响的逐步加深,互联网文本情感分析不仅在自然语言处理领域有着重要的研究意义,而且更对现实生活有着重要的利用价值。近年来,国内外对文本情感的研究一直在进行中,且取得了不少研究成果,但目前大部分的研究具有语言局限性,再加上当前可用的有效的文本情感数据集较少,因此目前的中文文本的情感分析还存在很多局限性。针对中文文本的情感分析,本文主要研究词向量表示模型的改进、文本数据增强策略以及中文文本情感分类模型,并设计一个基于文本情感分析的网络舆情监控系统。本文的主要研究内容和创新点包括:(1)本文提出了两种改进的词向量表示模型,分别是基于CME(Concatenation Meta-embedding)的词向量表示模型和基于AME(Average Meta-embedding)的词向量表示模型。这两种词向量模型以不同的方式融合了word2vec和Glove词向量。实验结果表明,应用改进的词向量时有助于文本情感分类模型性能的提升。(2)针对中文语料库中有标记的情感数据集缺...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:85 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外相关研究
1.3 本文研究内容及创新点
1.4 本文的结构安排
1.5 本章小结
第二章 文本情感分类技术基础
2.1 情感分析概述
2.2 文本处理相关技术
2.2.1 文本预处理
2.2.2 经典文本表示方法
2.3 经典文本分类相关技术
2.3.1 K近邻算法(KNN)
2.3.2 支持向量机(SVM)
2.3.3 朴素贝叶斯
2.4 本章小结
第三章 文本情感分类模型相关技术改进与模型设计
3.1 引言
3.2 模型设计使用的理论基础介绍
3.2.1 词向量技术介绍
3.2.1.1 word2vec
3.2.1.2 Glove
3.2.2 常用网络介绍
3.2.2.1 神经网络结构
3.2.2.2 卷积神经网络(CNN)
3.2.2.3 循环神经网络(RNN)
3.3 改进的词向量表示模型
3.3.1 基于CME的词向量表示模型
3.3.2 基于AME的词向量表示模型
3.4 文本数据增强策略设计
3.4.1 文本数据增强的必要性分析
3.4.2 基于EDA技术的文本数据增强策略
3.5 文本情感分类模型设计
3.5.1 基于HCRNN的文本情感分类模型结构
3.5.1.1 输入层设计
3.5.1.2 情感特征提取层设计
3.5.1.3 输出层设计
3.5.1.4 损失函数
3.5.1.5 拟合问题与优化训练过程
3.5.1.6 模型结构图
3.5.2 基于注意力机制的HCRNN-Att模型结构
3.5.3 基于TF-IDF特征的THCRNN-Att模型结构
3.6 本章小结
第四章 基于文本情感分析的网络舆情监控系统
4.1 引言
4.2 系统设计目标
4.2.1 系统设计难点
4.2.2 系统目标
4.3 网络部署
4.4 系统功能与架构设计
4.5 系统模块设计
4.5.1 数据采集模块设计
4.5.2 数据预处理模块设计
4.5.3 舆情分析模块设计
4.6 本章小结
第五章 实验过程与结果分析
5.1 情感分类评价指标
5.2 实验环境与实验数据集
5.2.1 实验环境
5.2.2 实验数据
5.3 文本情感分类模型实验过程与结果分析
5.3.1 实验设计
5.3.2 词向量训练过程与分析
5.3.3 HCRNN系列模型训练过程与分析
5.3.3.1 模型训练过程
5.3.3.2 CNN和BiLSTM的实验结果
5.3.3.3 基于机器学习的对比实验
5.3.3.4 HCRNN系列模型实验结果
5.3.3.5 微博情感分析数据集实验
5.3.4 不同词向量之间的实验对比
5.3.5 文本增强策略实验与分析
5.3.6 实验总结
5.4 舆情监控系统测试与原型实现
5.4.1 系统测试与实现
5.4.2 系统原型展示
5.5 本章小结
第六章 总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的研究成果
【参考文献】:
期刊论文
[1]论“后真相”时代网络舆论的特点及其引导对策[J]. 程仕波. 思想理论教育. 2018(09)
[2]基于微博情感分析和社会网络分析的雾霾舆情研究[J]. 何跃,朱婷婷. 情报科学. 2018(07)
[3]基于SVM和CRF多特征组合的微博情感分析[J]. 李婷婷,姬东鸿. 计算机应用研究. 2015(04)
[4]面向微博短文本的细粒度情感特征抽取方法[J]. 贺飞艳,何炎祥,刘楠,刘健博,彭敏. 北京大学学报(自然科学版). 2014(01)
[5]基于马尔可夫链的舆情热度趋势分析[J]. 刘勘,李晶,刘萍. 计算机工程与应用. 2011(36)
[6]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
[7]统计语言模型及汉语音字转换的一些新结果[J]. 郭进. 中文信息学报. 1993(01)
硕士论文
[1]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012
本文编号:3287910
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:85 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外相关研究
1.3 本文研究内容及创新点
1.4 本文的结构安排
1.5 本章小结
第二章 文本情感分类技术基础
2.1 情感分析概述
2.2 文本处理相关技术
2.2.1 文本预处理
2.2.2 经典文本表示方法
2.3 经典文本分类相关技术
2.3.1 K近邻算法(KNN)
2.3.2 支持向量机(SVM)
2.3.3 朴素贝叶斯
2.4 本章小结
第三章 文本情感分类模型相关技术改进与模型设计
3.1 引言
3.2 模型设计使用的理论基础介绍
3.2.1 词向量技术介绍
3.2.1.1 word2vec
3.2.1.2 Glove
3.2.2 常用网络介绍
3.2.2.1 神经网络结构
3.2.2.2 卷积神经网络(CNN)
3.2.2.3 循环神经网络(RNN)
3.3 改进的词向量表示模型
3.3.1 基于CME的词向量表示模型
3.3.2 基于AME的词向量表示模型
3.4 文本数据增强策略设计
3.4.1 文本数据增强的必要性分析
3.4.2 基于EDA技术的文本数据增强策略
3.5 文本情感分类模型设计
3.5.1 基于HCRNN的文本情感分类模型结构
3.5.1.1 输入层设计
3.5.1.2 情感特征提取层设计
3.5.1.3 输出层设计
3.5.1.4 损失函数
3.5.1.5 拟合问题与优化训练过程
3.5.1.6 模型结构图
3.5.2 基于注意力机制的HCRNN-Att模型结构
3.5.3 基于TF-IDF特征的THCRNN-Att模型结构
3.6 本章小结
第四章 基于文本情感分析的网络舆情监控系统
4.1 引言
4.2 系统设计目标
4.2.1 系统设计难点
4.2.2 系统目标
4.3 网络部署
4.4 系统功能与架构设计
4.5 系统模块设计
4.5.1 数据采集模块设计
4.5.2 数据预处理模块设计
4.5.3 舆情分析模块设计
4.6 本章小结
第五章 实验过程与结果分析
5.1 情感分类评价指标
5.2 实验环境与实验数据集
5.2.1 实验环境
5.2.2 实验数据
5.3 文本情感分类模型实验过程与结果分析
5.3.1 实验设计
5.3.2 词向量训练过程与分析
5.3.3 HCRNN系列模型训练过程与分析
5.3.3.1 模型训练过程
5.3.3.2 CNN和BiLSTM的实验结果
5.3.3.3 基于机器学习的对比实验
5.3.3.4 HCRNN系列模型实验结果
5.3.3.5 微博情感分析数据集实验
5.3.4 不同词向量之间的实验对比
5.3.5 文本增强策略实验与分析
5.3.6 实验总结
5.4 舆情监控系统测试与原型实现
5.4.1 系统测试与实现
5.4.2 系统原型展示
5.5 本章小结
第六章 总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的研究成果
【参考文献】:
期刊论文
[1]论“后真相”时代网络舆论的特点及其引导对策[J]. 程仕波. 思想理论教育. 2018(09)
[2]基于微博情感分析和社会网络分析的雾霾舆情研究[J]. 何跃,朱婷婷. 情报科学. 2018(07)
[3]基于SVM和CRF多特征组合的微博情感分析[J]. 李婷婷,姬东鸿. 计算机应用研究. 2015(04)
[4]面向微博短文本的细粒度情感特征抽取方法[J]. 贺飞艳,何炎祥,刘楠,刘健博,彭敏. 北京大学学报(自然科学版). 2014(01)
[5]基于马尔可夫链的舆情热度趋势分析[J]. 刘勘,李晶,刘萍. 计算机工程与应用. 2011(36)
[6]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
[7]统计语言模型及汉语音字转换的一些新结果[J]. 郭进. 中文信息学报. 1993(01)
硕士论文
[1]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012
本文编号:3287910
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3287910.html
最近更新
教材专著