文本的分层表示及情感分类方法研究
发布时间:2022-10-21 10:02
随着互联网的快速发展,网上的信息也在短时间内发生了爆炸性的增长。其中,文本作为一种非结构化或半结构化的信息载体,成为了互联网内容的重要组成部分。如何更有效地挖掘和发现其中的有价值信息并加以合理利用一直是当前信息科技领域面临的一大挑战。本文主要关注文本的情感分类任务,其目的是按照文本整体情感倾向对文档进行分类,或将评论站点上的评论进行1-5星的评价。而分类的关键在于对文本进行良好的表示,并且识别文档中的积极、消极、中立情感以及它们的表达强度。然而,现有的模型通常忽略了文档的组成结构,且在文本表示的质量以及对情感内容的关注上存在不足。对此,本文从文本的通用表示和情感内容的关注两方面入手,探讨如何提高情感分类性能,主要工作和贡献如下:(1)本文提出了一种中心限制的分层文本表示方法以改进文本的通用表示。本文提出的中心限制分层注意力模型(Central Constraint Hierarchical Attention Network,CCHAN)利用双向GRU首先对单词进行编码并通过注意力机制加权获得句向量,再通过对句向量进行编码和加权获得文档表示。其中,我们设计使用的中心限制损失函数使得生成...
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 文本的通用表示方法
1.2.2 文本的情感表示方法
1.2.3 文本的情感分类方法
1.3 面临的问题和挑战
1.4 本文研究内容与贡献
1.5 论文结构安排
第2章 中心限制的分层文本表示研究
2.1 引言
2.2 相关工作
2.2.1 词向量
2.2.2 循环神经网络编码器
2.2.3 注意力机制
2.2.4 研究进展
2.3 中心限制的分层注意力文本表示模型
2.3.1 基于循环神经网络的单词表示层
2.3.2 基于循环神经网络的句子表示层
2.3.3 中心限制损失函数
2.3.4 循环率学习优化器
2.4 实验结果与分析
2.4.1 数据集介绍
2.4.2 文本预处理和词向量训练
2.4.3 训练方式及参数设置
2.4.4 对比模型介绍
2.4.5 实验数据分析
2.5 本章小结
第3章 基于情感内容关注的情感分类方法研究
3.1 引言
3.2 相关工作
3.2.1 词语情感信息获取
3.2.2 词语情感信息利用
3.3 基于情感内容关注的分层注意力机制模型
3.3.1 基于循环神经网络的单词表示层
3.3.2 基于循环神经网络的文档表示层
3.3.3 注意力机制模块
3.3.4 情感分析模块
3.3.5 分段训练损失函数设计
3.4 实验结果与分析
3.4.1 数据集介绍
3.4.2 文本预处理和词向量训练
3.4.3 训练方式及参数设置
3.4.4 对比模型介绍
3.4.5 实验数据分析
3.5 本章小结
第4章 总结与展望
4.1 本文工作与创新点
4.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
【参考文献】:
期刊论文
[1]结合表示学习和迁移学习的跨领域情感分类[J]. 廖祥文,吴晓静,桂林,黄锦辉,陈国龙. 北京大学学报(自然科学版). 2019(01)
[2]基于HowNet和PMI的词语情感极性计算[J]. 王振宇,吴泽衡,胡方涛. 计算机工程. 2012(15)
[3]基于HowNet的词汇语义倾向计算[J]. 朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德. 中文信息学报. 2006(01)
硕士论文
[1]基于深度学习的微博文本情感分析研究[D]. 宋梦姣.南京大学 2018
[2]融合Bi-LSTM和文本信息的对象级情感分析[D]. 鲍豪.北京交通大学 2018
[3]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012
本文编号:3695427
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 文本的通用表示方法
1.2.2 文本的情感表示方法
1.2.3 文本的情感分类方法
1.3 面临的问题和挑战
1.4 本文研究内容与贡献
1.5 论文结构安排
第2章 中心限制的分层文本表示研究
2.1 引言
2.2 相关工作
2.2.1 词向量
2.2.2 循环神经网络编码器
2.2.3 注意力机制
2.2.4 研究进展
2.3 中心限制的分层注意力文本表示模型
2.3.1 基于循环神经网络的单词表示层
2.3.2 基于循环神经网络的句子表示层
2.3.3 中心限制损失函数
2.3.4 循环率学习优化器
2.4 实验结果与分析
2.4.1 数据集介绍
2.4.2 文本预处理和词向量训练
2.4.3 训练方式及参数设置
2.4.4 对比模型介绍
2.4.5 实验数据分析
2.5 本章小结
第3章 基于情感内容关注的情感分类方法研究
3.1 引言
3.2 相关工作
3.2.1 词语情感信息获取
3.2.2 词语情感信息利用
3.3 基于情感内容关注的分层注意力机制模型
3.3.1 基于循环神经网络的单词表示层
3.3.2 基于循环神经网络的文档表示层
3.3.3 注意力机制模块
3.3.4 情感分析模块
3.3.5 分段训练损失函数设计
3.4 实验结果与分析
3.4.1 数据集介绍
3.4.2 文本预处理和词向量训练
3.4.3 训练方式及参数设置
3.4.4 对比模型介绍
3.4.5 实验数据分析
3.5 本章小结
第4章 总结与展望
4.1 本文工作与创新点
4.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
【参考文献】:
期刊论文
[1]结合表示学习和迁移学习的跨领域情感分类[J]. 廖祥文,吴晓静,桂林,黄锦辉,陈国龙. 北京大学学报(自然科学版). 2019(01)
[2]基于HowNet和PMI的词语情感极性计算[J]. 王振宇,吴泽衡,胡方涛. 计算机工程. 2012(15)
[3]基于HowNet的词汇语义倾向计算[J]. 朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德. 中文信息学报. 2006(01)
硕士论文
[1]基于深度学习的微博文本情感分析研究[D]. 宋梦姣.南京大学 2018
[2]融合Bi-LSTM和文本信息的对象级情感分析[D]. 鲍豪.北京交通大学 2018
[3]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012
本文编号:3695427
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3695427.html