结合原因发现的文本情绪分类研究
发布时间:2021-07-08 21:10
社交媒体正在成为用户观点交流和情感表达的主要平台。用户在表达自身情感的同时,其相互作用也在不断影响现实社会。因此,基于自然语言处理技术的情绪分析、意图识别等研究的重要性不断提高。现有的文本情绪计算研究集中在利用文本中与情绪表达相关的表层特征对文本中包含的情绪进行识别和分类,但忽略了发掘情绪产生的原因以及对其的利用,因而缺乏对情绪相关信息的完整理解和应用。现有文本情绪原因发现方法主要分为基于规则、基于机器学习以及基于深度学习的方法。这三类方法分别存在人工规则构建低效、统计特征的设计和筛选主观性过强,以及模型可解释性与可控性较弱等问题。为此,本文首先研究有效的情绪原因发现方法,进而研究基于多任务学习的情绪原因发现与情绪分类方法,目的是充分利用情绪原因和情绪表达之间的交互关系,有效提高文本情绪分类性能。本文首先研究结合知识正则化和层次注意力网络的情绪原因发现方法。通过应用层次结构和注意力机制建模文本的篇章信息、子句与情绪表达之间的关系,以更好地发现情绪原因。同时,设计基于情感词和基于位置的正则化约束项,借助先验知识对上述模型参数进行约束。在EMNLP2016中文情绪原因发现数据集上的实验结果...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
本文研究内容框架图
哈尔滨工业大学工程硕士学位论文-10-本。然后利用NB、SVM、ME作为分类模型,准确率达到80%以上[37]。张志琳等人将目光聚焦于中文微博文本,结合情绪词典匹配与机器学习方法进行文本情绪分类。与此同时,他们也考虑了主题词是否出现、主题词的内容以及情绪词的频度等特征,接着将对词典倾向性打分的结果一起作为特征,通过SVM获得最后的分类标签。实验结果显示,该特征提取方式能够更好地反映微博中情绪的倾向,提升了微博情绪分类的效果[38]。2.2.3基于深度学习的文本情绪分类方法深度学习方法表通过多层非线性的神经元对输入文本进行特征提取和变换,表现出了强大的特征表示能力,因此受到广泛关注。Socher等人采用深度学习的思想来解决文本情绪分析领域的问题。利用WordNet和FreeBase,并借助递归神经张量网络来学习文本中的语法树以及树节点上的情绪类别,来判断树中根节点的情绪类别,取得了不错的成果[39]。Tang等人提出一种结构化的神经网络对篇章级文本进行情绪分类。作者在词向量的基础上,利用CNN或长短时记忆模型[40](LongShort-TermMemory,LSTM)学习句子的向量表示,然后利用另外的双向门控网络(GatedNeuralNetwork,GNN)分别从正向和逆向对句子的语义及其在篇章中的关系进行编码,最后将学习到的整个篇章向量表示送入softmax,进而实现对篇章的情绪分类,其模型框架如图2-2所示[41]。图2-2基于结构化的神经网络篇章级情感分类模型[41]
哈尔滨工业大学工程硕士学位论文-11-Fan等人提出一种基于卷积记忆网络的方面级情感分类模型。作者首先利用双向门控单元[42](GatedRecurrentUnit,GRU)Bi-GRU来捕获文本的全局语义信息。他们认为文本中每个词的重要程度不仅取决于当前词,还与上下文密切相关。因此,作者利用卷积记忆机制综合考虑每个位置词及其前后词以计算注意力权重,然后对各文本片段加权求和得到最终的分类结果。其模型如图2-3所示[8]。图2-3基于特定目标的卷积记忆网络情感分类模型[8]2.3文本情绪原因发现相关技术文本情绪原因发现任务是在文本情绪分类基础上的深入,旨在研究发现触发情绪产生的事件或因素的方法。文本情绪原因发现任务上的相关研究推动了文本情绪分析领域的发展,同时也为情绪分类等基础研究拓宽了视野。现有的文本情绪原因发现方法主要包括基于规则、机器学习及深度学习的方法。2.3.1基于规则与常识库的情绪原因发现方法基于规则的情绪原因发现方法主要通过分析文本中的语言结构,并针对所标注的语料库,利用与表达情绪原因相关的指示性词语、句法、语法等线索手工构建情绪原因发现规则库,从而利用规则来对情绪原因进行识别。
【参考文献】:
期刊论文
[1]基于E-CNN的情绪原因识别方法[J]. 慕永利,李旸,王素格. 中文信息学报. 2018(02)
[2]基于多注意力卷积神经网络的特定目标情感分析[J]. 梁斌,刘全,徐进,周倩,章鹏. 计算机研究与发展. 2017(08)
[3]结合卷积神经网络和词语情感序列特征的中文情感分析[J]. 陈钊,徐睿峰,桂林,陆勤. 中文信息学报. 2015(06)
[4]基于多样化特征的中文微博情感分类方法研究[J]. 张志琳,宗成庆. 中文信息学报. 2015(04)
[5]多策略中文微博细粒度情绪分析研究[J]. 欧阳纯萍,阳小华,雷龙艳,徐强,余颖,刘志明. 北京大学学报(自然科学版). 2014(01)
[6]基于情绪知识的中文微博情感分类方法[J]. 庞磊,李寿山,周国栋. 计算机工程. 2012(13)
硕士论文
[1]基于文本的情绪自动归因方法研究[D]. 袁丽.哈尔滨工业大学 2014
本文编号:3272341
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
本文研究内容框架图
哈尔滨工业大学工程硕士学位论文-10-本。然后利用NB、SVM、ME作为分类模型,准确率达到80%以上[37]。张志琳等人将目光聚焦于中文微博文本,结合情绪词典匹配与机器学习方法进行文本情绪分类。与此同时,他们也考虑了主题词是否出现、主题词的内容以及情绪词的频度等特征,接着将对词典倾向性打分的结果一起作为特征,通过SVM获得最后的分类标签。实验结果显示,该特征提取方式能够更好地反映微博中情绪的倾向,提升了微博情绪分类的效果[38]。2.2.3基于深度学习的文本情绪分类方法深度学习方法表通过多层非线性的神经元对输入文本进行特征提取和变换,表现出了强大的特征表示能力,因此受到广泛关注。Socher等人采用深度学习的思想来解决文本情绪分析领域的问题。利用WordNet和FreeBase,并借助递归神经张量网络来学习文本中的语法树以及树节点上的情绪类别,来判断树中根节点的情绪类别,取得了不错的成果[39]。Tang等人提出一种结构化的神经网络对篇章级文本进行情绪分类。作者在词向量的基础上,利用CNN或长短时记忆模型[40](LongShort-TermMemory,LSTM)学习句子的向量表示,然后利用另外的双向门控网络(GatedNeuralNetwork,GNN)分别从正向和逆向对句子的语义及其在篇章中的关系进行编码,最后将学习到的整个篇章向量表示送入softmax,进而实现对篇章的情绪分类,其模型框架如图2-2所示[41]。图2-2基于结构化的神经网络篇章级情感分类模型[41]
哈尔滨工业大学工程硕士学位论文-11-Fan等人提出一种基于卷积记忆网络的方面级情感分类模型。作者首先利用双向门控单元[42](GatedRecurrentUnit,GRU)Bi-GRU来捕获文本的全局语义信息。他们认为文本中每个词的重要程度不仅取决于当前词,还与上下文密切相关。因此,作者利用卷积记忆机制综合考虑每个位置词及其前后词以计算注意力权重,然后对各文本片段加权求和得到最终的分类结果。其模型如图2-3所示[8]。图2-3基于特定目标的卷积记忆网络情感分类模型[8]2.3文本情绪原因发现相关技术文本情绪原因发现任务是在文本情绪分类基础上的深入,旨在研究发现触发情绪产生的事件或因素的方法。文本情绪原因发现任务上的相关研究推动了文本情绪分析领域的发展,同时也为情绪分类等基础研究拓宽了视野。现有的文本情绪原因发现方法主要包括基于规则、机器学习及深度学习的方法。2.3.1基于规则与常识库的情绪原因发现方法基于规则的情绪原因发现方法主要通过分析文本中的语言结构,并针对所标注的语料库,利用与表达情绪原因相关的指示性词语、句法、语法等线索手工构建情绪原因发现规则库,从而利用规则来对情绪原因进行识别。
【参考文献】:
期刊论文
[1]基于E-CNN的情绪原因识别方法[J]. 慕永利,李旸,王素格. 中文信息学报. 2018(02)
[2]基于多注意力卷积神经网络的特定目标情感分析[J]. 梁斌,刘全,徐进,周倩,章鹏. 计算机研究与发展. 2017(08)
[3]结合卷积神经网络和词语情感序列特征的中文情感分析[J]. 陈钊,徐睿峰,桂林,陆勤. 中文信息学报. 2015(06)
[4]基于多样化特征的中文微博情感分类方法研究[J]. 张志琳,宗成庆. 中文信息学报. 2015(04)
[5]多策略中文微博细粒度情绪分析研究[J]. 欧阳纯萍,阳小华,雷龙艳,徐强,余颖,刘志明. 北京大学学报(自然科学版). 2014(01)
[6]基于情绪知识的中文微博情感分类方法[J]. 庞磊,李寿山,周国栋. 计算机工程. 2012(13)
硕士论文
[1]基于文本的情绪自动归因方法研究[D]. 袁丽.哈尔滨工业大学 2014
本文编号:3272341
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3272341.html
最近更新
教材专著