基于深度学习的可解释性情感分析模型研究
发布时间:2021-11-14 16:41
社交网络的迅猛发展为人们提供了发表和分享个人言论的广阔平台,各种网络数据迅速膨胀,越来越多的人在网络上发表意见和表达情感,潜在用户可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事物或产品的看法,因此,如何利用自然语言处理(Natural Language Processing,NLP)技术分析社交网络短文本的情感倾向,已经成为研究人员关注的热点。目前,深度学习方法已经在很多情感分析任务中取得了先进的成果,这些研究多数使用卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网路(Recurrent Neural Networks,RNN),尤其是LSTM(Long Short-Term Memory)和GRU(Gated Recurrent Unit)等RNN衍生网络,不仅可以更好的解决文本序列问题,还可以一定程度上避免梯度消失,得到更好的分类效果。然而,深度学习模型通常作为“黑盒”使用,即模型只给出最后的分类结果,并未对模型的分类结果和决策做出可以理解的解释,这使得用户无法完全信任模型给出的结果从而无法帮助用户进行合理的决策。同时,研究表明...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
商品评论摘要
第1章绪论2根据已有经验,当人类对于某事物做出分析和判断时,不仅仅基于该事物所给出的原有信息,而更多的是结合已有的知识,如常识、定理等进行思考。目前,现有的情感分析模型中多数只着眼于文本上下文特征间的关系挖掘,缺乏对深层神经网络外部知识的有效整合,如何利用已有的知识指导分类器决策,也成为本文研究的重点之一。1.2国内外研究现状如图1.2所示,情感分析任务从层次上可分为:文档级别情感分析、句子级别情感分析、特定方面级别情感分析[3]。例如一段评论文本“①Thisphonewasgiventomywifeasabirthdaygift,andshelikeditverymuch.②Theappearanceofthephoneisverycute,thepinkbodyisverysuitableforgirlstouse,thecameraisveryhighandhasautomaticbeautyfunction.③Thestandbytimeofmobileisaverage,butthisisacommonproblemwithsmartphones.④Thescreenislargeandclear,butthepriceisreallyexpensive.”针对此文本评论,文档级别情感分析的任务是预测整段文本的情感倾向,句子级别情感分析的任务为分别预测句子①-⑤每一句的情感极性,而方面级别的情感分析任务是识别句子中不同特定方面“appearance”、“body”、“camera”、“standbytime”、“screen”和“price”的情感极性。图1.2情感分析按层次分类目前,主流的情感分析方法按技术路线主要可分为3类[4]:1)基于词典的方法;2)基于机器学习的方法;3)基于深度学习的方法:
第2章相关技术概述7第2章相关技术概述根据本文的研究内容,在本章将就相关技术进行概述,首先介绍当下常用的word2vec技术,然后对注意力机制、Apriori算法、外部情感知识库SenticNet进行介绍,最后对实验涉及的3种深度神经网络进行描述,分别为CNN、LSTM和Transformer。2.1word2vec在自然语言处理任务中,文本单词向量化是解决各类问题的重要前提。传统的向量化方法,例如,one-hot表示、词袋(BagofWords)和N-gram等模型,在当下深度学习迅速发展的背景下其存在的弱点和缺陷也越来越明显,主要表现在:1)随着词典的不断增大,向量维度也会不断增长;2)字典的存储会消耗非常大的空间资源;3)在一些模型中会出现稀疏性问题;4)稳定性较差。为解决上述问题,近年来,word2vec技术[23]在自然语言处理任务中得到广泛应用,如图2.1所示,其利用简单化的神经网络训练词向量,其中,输入层的输入为单词的One-Hot向量,经过没有激活函数的隐藏层进行线性映射,最后通过softmax函数得到与输入维度一致的输出。目前,CBOW(ContinuousBag-of-Words)和Skip-Gram是word2vec技术最常用的两种模型,在本节中将对这两种模型进行详细介绍。图2.1word2vec工作流程
【参考文献】:
期刊论文
[1]面向双注意力网络的特定方面情感分析模型[J]. 孙小婉,王英,王鑫,孙玉东. 计算机研究与发展. 2019(11)
[2]情感分类研究进展[J]. 陈龙,管子玉,何金红,彭进业. 计算机研究与发展. 2017(06)
本文编号:3494986
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
商品评论摘要
第1章绪论2根据已有经验,当人类对于某事物做出分析和判断时,不仅仅基于该事物所给出的原有信息,而更多的是结合已有的知识,如常识、定理等进行思考。目前,现有的情感分析模型中多数只着眼于文本上下文特征间的关系挖掘,缺乏对深层神经网络外部知识的有效整合,如何利用已有的知识指导分类器决策,也成为本文研究的重点之一。1.2国内外研究现状如图1.2所示,情感分析任务从层次上可分为:文档级别情感分析、句子级别情感分析、特定方面级别情感分析[3]。例如一段评论文本“①Thisphonewasgiventomywifeasabirthdaygift,andshelikeditverymuch.②Theappearanceofthephoneisverycute,thepinkbodyisverysuitableforgirlstouse,thecameraisveryhighandhasautomaticbeautyfunction.③Thestandbytimeofmobileisaverage,butthisisacommonproblemwithsmartphones.④Thescreenislargeandclear,butthepriceisreallyexpensive.”针对此文本评论,文档级别情感分析的任务是预测整段文本的情感倾向,句子级别情感分析的任务为分别预测句子①-⑤每一句的情感极性,而方面级别的情感分析任务是识别句子中不同特定方面“appearance”、“body”、“camera”、“standbytime”、“screen”和“price”的情感极性。图1.2情感分析按层次分类目前,主流的情感分析方法按技术路线主要可分为3类[4]:1)基于词典的方法;2)基于机器学习的方法;3)基于深度学习的方法:
第2章相关技术概述7第2章相关技术概述根据本文的研究内容,在本章将就相关技术进行概述,首先介绍当下常用的word2vec技术,然后对注意力机制、Apriori算法、外部情感知识库SenticNet进行介绍,最后对实验涉及的3种深度神经网络进行描述,分别为CNN、LSTM和Transformer。2.1word2vec在自然语言处理任务中,文本单词向量化是解决各类问题的重要前提。传统的向量化方法,例如,one-hot表示、词袋(BagofWords)和N-gram等模型,在当下深度学习迅速发展的背景下其存在的弱点和缺陷也越来越明显,主要表现在:1)随着词典的不断增大,向量维度也会不断增长;2)字典的存储会消耗非常大的空间资源;3)在一些模型中会出现稀疏性问题;4)稳定性较差。为解决上述问题,近年来,word2vec技术[23]在自然语言处理任务中得到广泛应用,如图2.1所示,其利用简单化的神经网络训练词向量,其中,输入层的输入为单词的One-Hot向量,经过没有激活函数的隐藏层进行线性映射,最后通过softmax函数得到与输入维度一致的输出。目前,CBOW(ContinuousBag-of-Words)和Skip-Gram是word2vec技术最常用的两种模型,在本节中将对这两种模型进行详细介绍。图2.1word2vec工作流程
【参考文献】:
期刊论文
[1]面向双注意力网络的特定方面情感分析模型[J]. 孙小婉,王英,王鑫,孙玉东. 计算机研究与发展. 2019(11)
[2]情感分类研究进展[J]. 陈龙,管子玉,何金红,彭进业. 计算机研究与发展. 2017(06)
本文编号:3494986
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3494986.html
最近更新
教材专著