基于Doc2vec和深度学习的文本情感分析研究
发布时间:2021-11-04 11:11
情感分析作为自然语言处理的重要组成部分之一,其主要任务是识别和处理给定文本中包含的情感极性、强度等信息。目前情感分析技术广泛用于舆论监测、金融分析、决策支持等任务当中,对政府、金融、商业等领域产生了重要影响。以往的研究将重点放在情感词典的构造和特征提取方法的改进上,但其采用的方法耗时耗力不宜维护且迁移性差。近年来深度学习因其可自动学习数据特征的优势成为了自然语言处理的主流研究方法,然而该方法在处理情感分析时忽略了词序信息对分类结果的影响,且在提取句子结构和过滤无效信息方面也有不足。因此,通过改进深度学习模型来解决上述问题对于提高文本情感分析的性能有着重要意义。基于以上的考虑,首先,本文为了解决深度学习情感分析方法在获取词序信息和句子结构信息方面的不足,设计了一种结合Doc2vec的卷积神经网络模型CMCNN。一方面,将Doc2vec模型训练得到的段落向量作为卷积神经网络连接层的附加向量来提供传统词向量所欠缺的词序信息。另一方面,本文的CNN模型在池化层上与传统的CNN不同,采用Chunk Max Pooling策略保证CNN模型在训练过程中获取重要特征的同时保留其位置信息,从而使得该模...
【文章来源】:华北电力大学河北省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
017.12-2018.06中国网民各类互联网应用使用率
图 1-2 基于情感词典和规则的文本情感分析流程基于传统机器学习的方法则是一种有监督的分类方法,它与上一类解决办法的不同之处在于:机器学习方法并不关心文本中相关词的情感极性,它是通过对已经被标注了情感类别的文本进行学习来获取分类能力。采用机器学习来处理情感分析需要将一些已标注好情感类型的文本作为训练集,输入到诸如支持向量机(SVM)、逻辑回归、朴素贝叶斯等机器学习算法中进行分类训练,再通过已标注情感类别的测试集对分类模型进行性能评估,最终获得一个可以进行正确分类的情感分类器。分类器训练成功后就可以对未标记类别的待分类文本进行分类处理了。其工作流程如图 1-3 所示。
图 1-2 基于情感词典和规则的文本情感分析流程基于传统机器学习的方法则是一种有监督的分类方法,它与上一类解决办法的不同之处在于:机器学习方法并不关心文本中相关词的情感极性,它是通过对已经被标注了情感类别的文本进行学习来获取分类能力。采用机器学习来处理情感分析需要将一些已标注好情感类型的文本作为训练集,输入到诸如支持向量机(SVM)、逻辑回归、朴素贝叶斯等机器学习算法中进行分类训练,再通过已标注情感类别的测试集对分类模型进行性能评估,最终获得一个可以进行正确分类的情感分类器。分类器训练成功后就可以对未标记类别的待分类文本进行分类处理了。其工作流程如图 1-3 所示。
【参考文献】:
期刊论文
[1]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊. 计算机工程与科学. 2017(01)
博士论文
[1]文本情感分类及观点摘要关键问题研究[D]. 张冬梅.山东大学 2012
硕士论文
[1]目标函数与策略优化的文本情感分析研究[D]. 巩世兵.浙江大学 2017
[2]聚类算法和卷积神经网络在文本情感分析中的应用研究[D]. 何云超.云南大学 2016
[3]基于深度学习的情感词向量及文本情感分析的研究[D]. 张志华.华东师范大学 2016
[4]面向英文电影评论的文本情感倾向性分类研究[D]. 冯莉.大连海事大学 2013
本文编号:3475608
【文章来源】:华北电力大学河北省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
017.12-2018.06中国网民各类互联网应用使用率
图 1-2 基于情感词典和规则的文本情感分析流程基于传统机器学习的方法则是一种有监督的分类方法,它与上一类解决办法的不同之处在于:机器学习方法并不关心文本中相关词的情感极性,它是通过对已经被标注了情感类别的文本进行学习来获取分类能力。采用机器学习来处理情感分析需要将一些已标注好情感类型的文本作为训练集,输入到诸如支持向量机(SVM)、逻辑回归、朴素贝叶斯等机器学习算法中进行分类训练,再通过已标注情感类别的测试集对分类模型进行性能评估,最终获得一个可以进行正确分类的情感分类器。分类器训练成功后就可以对未标记类别的待分类文本进行分类处理了。其工作流程如图 1-3 所示。
图 1-2 基于情感词典和规则的文本情感分析流程基于传统机器学习的方法则是一种有监督的分类方法,它与上一类解决办法的不同之处在于:机器学习方法并不关心文本中相关词的情感极性,它是通过对已经被标注了情感类别的文本进行学习来获取分类能力。采用机器学习来处理情感分析需要将一些已标注好情感类型的文本作为训练集,输入到诸如支持向量机(SVM)、逻辑回归、朴素贝叶斯等机器学习算法中进行分类训练,再通过已标注情感类别的测试集对分类模型进行性能评估,最终获得一个可以进行正确分类的情感分类器。分类器训练成功后就可以对未标记类别的待分类文本进行分类处理了。其工作流程如图 1-3 所示。
【参考文献】:
期刊论文
[1]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊. 计算机工程与科学. 2017(01)
博士论文
[1]文本情感分类及观点摘要关键问题研究[D]. 张冬梅.山东大学 2012
硕士论文
[1]目标函数与策略优化的文本情感分析研究[D]. 巩世兵.浙江大学 2017
[2]聚类算法和卷积神经网络在文本情感分析中的应用研究[D]. 何云超.云南大学 2016
[3]基于深度学习的情感词向量及文本情感分析的研究[D]. 张志华.华东师范大学 2016
[4]面向英文电影评论的文本情感倾向性分类研究[D]. 冯莉.大连海事大学 2013
本文编号:3475608
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3475608.html
最近更新
教材专著