基于深度学习的微博短文本情感分析技术研究
发布时间:2022-11-04 22:06
随着网络技术的普及、网络文化的多元化发展以及我国网民的日益增多,社交媒体工具成为人们日常生活必不可少的交流媒介,社交媒体文本的情感分析也逐渐成为自然语言处理领域的一个活跃的研究方向。微博由于其简单易用,传播迅速等特点,成为大众发表言论、表达情感的重要平台之一,因此产生了大量带有情感的文本数据,对这些带有情感的微博文本进行情感分析将为政府、企业以及个人的决策提供有效地帮助。然而,在现在的网络大环境下,人们表达自己观点和情绪的词语越来越多,为了提高处理情感分析任务的水平,针对微博短文本网络新词多、文本特征密度低等特点,本文对微博新词发现方法、微博短文本向量表示模型以及微博短文本情感分类模型进行了研究。主要研究工作包括:(1)针对基于N-Gram的新词发现方法产生很多垃圾词串的问题,本文结合互信息、左右邻接熵等统计量以及停用词典和常用词典对微博新词发现方法进行了研究。对N-Gram切词产生的二元和三元组,分别使用互信息和邻接熵对词语的内部凝固度和边界自由度进行了度量,得到候选词集后,再使用停用词典和常用词典加以过滤,得到最终新词集。实验结果表明,所提新词发现方法在NLPCC2014微博语料数...
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 新词发现研究现状
1.2.2 向量表示模型研究现状
1.2.3 微博情感分析研究现状
1.3 研究内容
1.4 组织结构
1.5 本章小结
2 相关理论
2.1 新词发现相关理论
2.1.1 N-Gram语言模型
2.1.2 统计量介绍
2.2 词向量表示模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 注意力机制
2.4 深度学习相关理论
2.4.1 卷积神经网络
2.4.2 循环神经网络
2.4.3 长短期记忆网络
2.4.4 门控循环单元
2.5 本章小结
3 微博新词发现方法
3.1 基于N-Gram和统计相结合的新词发现方法
3.2 数据预处理
3.2.1 数据集介绍
3.2.2 数据清洗
3.2.3 N-Gram切词
3.3 新词候选集选取
3.4 垃圾词串过滤
3.5 新词词典构建
3.6 实验及结果分析
3.6.1 实验评价指标
3.6.2 阈值设定
3.6.3 结果与分析
3.7 本章小结
4 短文本向量表示模型
4.1 向量表示模型的构建过程
4.2 基于BERT的短文本向量表示模型
4.3 实验及结果分析
4.3.1 数据预处理
4.3.2 评价指标
4.3.3 实验参数设置
4.3.4 实验结果与分析
4.4 本章小结
5 基于BiGRU-Att的情感分类模型
5.1 BiGRU网络模型
5.2 注意力机制
5.3 基于BiGRU-Att的情感分类模型结构
5.3.1 输入层
5.3.2 BiGRU层
5.3.3 注意力层
5.3.4 分类输出层
5.4 实验及结果分析
5.4.1 模型超参数设置
5.4.2 对比实验
5.4.3 实验结果分析
5.5 本章小结
6 总结与展望
6.1 工作总结
6.2 工作展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
【参考文献】:
期刊论文
[1]基于领域词典的民宿评论情感分析[J]. 杨鑫,杨云帆,焦维,朱东霖,郑绍阳,袁中玉,杨秀璋,罗子江. 科学技术与工程. 2020(07)
[2]基于注意力机制Bi-LSTM算法的双语文本情感分析[J]. 翟社平,杨媛媛,邱程,李婧,毋志云. 计算机应用与软件. 2019(12)
[3]网络时代大学生思想政治教育的挑战与对策[J]. 兰明尚,郭丛斌. 中国高等教育. 2019(23)
[4]基于CNN-BIGRU的中文文本情感分类模型[J]. 宋祖康,阎瑞霞. 计算机技术与发展. 2020(02)
[5]基于神经网络模型的文本分类研究综述[J]. 孙嘉琪,王晓晔,周晓雯. 天津理工大学学报. 2019(05)
[6]融合多粒度信息的文本向量表示模型[J]. 聂维民,陈永洲,马静. 数据分析与知识发现. 2019(09)
[7]基于多部情感词典和规则集的中文微博情感分析研究[J]. 吴杰胜,陆奎. 计算机应用与软件. 2019(09)
[8]基于互信息和逻辑回归的新词发现[J]. 陈先来,韩超鹏,安莹,刘莉,李忠民,杨荣. 数据分析与知识发现. 2019(08)
[9]结合信息量和深度学习的领域新词发现[J]. 黄文明,杨柳青青,任冲. 计算机工程与设计. 2019(07)
[10]基于句法分析与词向量的领域新词发现方法[J]. 赵志滨,石玉鑫,李斌阳. 计算机科学. 2019(06)
硕士论文
[1]基于深度学习的微博情感分析研究[D]. 赵希明.北方工业大学 2019
[2]使用深度学习技术的中文微博情感分析研究[D]. 邓洋.西南交通大学 2018
[3]基于深度学习的微博评论情感倾向性分析[D]. 胡西祥.哈尔滨工业大学 2017
[4]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[5]中文新词检测与分析[D]. 崔世起.中国科学院研究生院(计算技术研究所) 2006
本文编号:3701415
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 新词发现研究现状
1.2.2 向量表示模型研究现状
1.2.3 微博情感分析研究现状
1.3 研究内容
1.4 组织结构
1.5 本章小结
2 相关理论
2.1 新词发现相关理论
2.1.1 N-Gram语言模型
2.1.2 统计量介绍
2.2 词向量表示模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 注意力机制
2.4 深度学习相关理论
2.4.1 卷积神经网络
2.4.2 循环神经网络
2.4.3 长短期记忆网络
2.4.4 门控循环单元
2.5 本章小结
3 微博新词发现方法
3.1 基于N-Gram和统计相结合的新词发现方法
3.2 数据预处理
3.2.1 数据集介绍
3.2.2 数据清洗
3.2.3 N-Gram切词
3.3 新词候选集选取
3.4 垃圾词串过滤
3.5 新词词典构建
3.6 实验及结果分析
3.6.1 实验评价指标
3.6.2 阈值设定
3.6.3 结果与分析
3.7 本章小结
4 短文本向量表示模型
4.1 向量表示模型的构建过程
4.2 基于BERT的短文本向量表示模型
4.3 实验及结果分析
4.3.1 数据预处理
4.3.2 评价指标
4.3.3 实验参数设置
4.3.4 实验结果与分析
4.4 本章小结
5 基于BiGRU-Att的情感分类模型
5.1 BiGRU网络模型
5.2 注意力机制
5.3 基于BiGRU-Att的情感分类模型结构
5.3.1 输入层
5.3.2 BiGRU层
5.3.3 注意力层
5.3.4 分类输出层
5.4 实验及结果分析
5.4.1 模型超参数设置
5.4.2 对比实验
5.4.3 实验结果分析
5.5 本章小结
6 总结与展望
6.1 工作总结
6.2 工作展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
【参考文献】:
期刊论文
[1]基于领域词典的民宿评论情感分析[J]. 杨鑫,杨云帆,焦维,朱东霖,郑绍阳,袁中玉,杨秀璋,罗子江. 科学技术与工程. 2020(07)
[2]基于注意力机制Bi-LSTM算法的双语文本情感分析[J]. 翟社平,杨媛媛,邱程,李婧,毋志云. 计算机应用与软件. 2019(12)
[3]网络时代大学生思想政治教育的挑战与对策[J]. 兰明尚,郭丛斌. 中国高等教育. 2019(23)
[4]基于CNN-BIGRU的中文文本情感分类模型[J]. 宋祖康,阎瑞霞. 计算机技术与发展. 2020(02)
[5]基于神经网络模型的文本分类研究综述[J]. 孙嘉琪,王晓晔,周晓雯. 天津理工大学学报. 2019(05)
[6]融合多粒度信息的文本向量表示模型[J]. 聂维民,陈永洲,马静. 数据分析与知识发现. 2019(09)
[7]基于多部情感词典和规则集的中文微博情感分析研究[J]. 吴杰胜,陆奎. 计算机应用与软件. 2019(09)
[8]基于互信息和逻辑回归的新词发现[J]. 陈先来,韩超鹏,安莹,刘莉,李忠民,杨荣. 数据分析与知识发现. 2019(08)
[9]结合信息量和深度学习的领域新词发现[J]. 黄文明,杨柳青青,任冲. 计算机工程与设计. 2019(07)
[10]基于句法分析与词向量的领域新词发现方法[J]. 赵志滨,石玉鑫,李斌阳. 计算机科学. 2019(06)
硕士论文
[1]基于深度学习的微博情感分析研究[D]. 赵希明.北方工业大学 2019
[2]使用深度学习技术的中文微博情感分析研究[D]. 邓洋.西南交通大学 2018
[3]基于深度学习的微博评论情感倾向性分析[D]. 胡西祥.哈尔滨工业大学 2017
[4]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[5]中文新词检测与分析[D]. 崔世起.中国科学院研究生院(计算技术研究所) 2006
本文编号:3701415
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3701415.html