基于特征融合的文本情感分析
发布时间:2021-07-17 21:20
互联网技术一日千里,推动社交网络等互联网领域快速的发展,特别重要的是日趋完善的移动端互联网技术,使得用户可以方便地在网上发表自己的观点以及发布自己身边有趣的事情,并且这些大都是文本结构的信息,对文本信息进行情感分析可以帮助企业等组织了解用户的喜好,调整发展的方向以适应市场。本文研究内容针对如何提高文本情感分析的分类效果,从文档级文本情感分析和方面级文本情感分析进行研究,主要内容如下:一方面,文档级文本情感分析,构建混合神经网络层-利用基于注意力机制的胶囊网络(Capsule Network,CapNets)模型和双向门循环单元(Bi-directional Gate Recurrent Unit,BiGRU)模型充分提取局部特征信息和全局特征信息,自适应地感知上下文信息并提取影响文本情感分析的特征信息,将模型学习的特征信息进行融合。接着,两种不同词向量(Word Vector)表示的文本信息分别经过混合神经网络层,并将结果进一步融合,用Softmax对融合结果进行分类。本模型与基准模型比较分析,模型的运行结果说明提出的模型具有可行性。另一方面,方面级文本情感分析,考虑方面项位置信息的影...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2.?1?CBOW模型架构??Fig.?2.1?CBOW?Model?Architecture??-13?-??
?基于特征融合的文本情感分析???多个单词的上下文CBOW模型如图2.2所示。??§?'?Input?layer??:??°?\\??:vvvwVV??oj?\??〇i?\?llidclpn?layer?*aycr??f????^-一〇??t??-、,筒????X3k?〇?O??:Z,、、#?:??:?K-d呻??-W^/????f?/?’??2K?Cx?^-dim??图2.?2多个单词上下文的CBOW模型??Fig.?2.2?CBOW?Model?of?Multiple?Word?Contexts??输入层:由w;领域半径r内的文本单词{;q,;c2,…,xe}组成,单词是用One-Hot编码??表示输入,C为大小,7为词汇表的词汇数。??隐藏层:iV维的向量,输入向量利用FX/V维的权重矩阵W计算隐藏层。隐藏层的输??出计算/I是输入向量的加权平均。??h丄妒.([c?x?)??C?(“1?"?(2.6)??输出层:输出单词y,同样是用One-Hot编码方式表示,利用一个iVxK维的权重矩??阵VT计算输出层。输出层每个节点输入u;,其中是输出矩阵M/'的第/列。??w?=(v'?)?-h??J?V?(2.7)??,?、?exp(?w?.)?|??叉.,广叫…羚卜 ̄ ̄??>?exp?w?.??^J=l?V?W?(2.8)??权重矩阵W与14/用随机值进行初始化,使用反向传播(Back?Propagation,?BP)算法纠??正并更新权重矩阵。??(2)?Skip-gram?模型??Skip-gram模型与CBOW模型过程是相反的,给定中心词w;
大连海事大学硕士学位论文???seat?your?love?upon?a?precipice?because?it?is?high.”输入“upon”,窗口大小为?3,则输出是??{?“seat”,?“your”,“love”,“a”,“precipice”?/‘because’’},Skip-gram?模型架构如图?2.3?所示。??IIMF?UT?F*ROJHOTI〇M?OUTF?UX??我?w(l-2)??W(l>?i?\?^??Vs??SKip>gram??图2.?3?Skim-gram模型架构??Fig.?2.3?Skim-gram?Model?Architecture??多个单词的上下文的Skip-gram模型结构如图2.4所示。??〇?Output?layer??/卜??Input?layer?/?W?^???5I?-?,?l-lidden?layer/?n????'?^?'????**?°?h,?a?;<?w^-K?°??〇l?-?^?JV-dimS.?"?''?'x:?^?l〇j??r?aim?\w?SS??\j-??O*?f^dinn??图2.?4多个单词上下文的Skim-gram模型??Fig.?2.4?Skim-gram?Model?of?Multiple?Word?Contexts??输入层:单词w的One-Hot表示&,??隐藏层:隐藏层的输出/i利用y?x?iv维的权重矩阵w计算隐藏层。??h?=?xIW?=?'.:=vw!?(2?9)??输出层:上一层的输出yd,利用一个况XK维的权重矩阵14/'计算输出层。输??出层单词共享权重,故1^/=
【参考文献】:
期刊论文
[1]基于并行混合神经网络模型的短文本情感分析[J]. 陈洁,邵志清,张欢欢,费佳慧. 计算机应用. 2019(08)
[2]基于深度学习的社交网络平台细粒度情感分析[J]. 李阳辉,谢明,易阳. 计算机应用研究. 2017(03)
[3]基于领域情感词典的中文微博情感分析[J]. 肖江,丁星,何荣杰. 电子设计工程. 2015(12)
[4]中文微博情感词典构建方法[J]. 周咏梅,阳爱民,林江豪. 山东大学学报(工学版). 2014(03)
[5]基于HowNet的词汇语义倾向计算[J]. 朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德. 中文信息学报. 2006(01)
本文编号:3288953
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2.?1?CBOW模型架构??Fig.?2.1?CBOW?Model?Architecture??-13?-??
?基于特征融合的文本情感分析???多个单词的上下文CBOW模型如图2.2所示。??§?'?Input?layer??:??°?\\??:vvvwVV??oj?\??〇i?\?llidclpn?layer?*aycr??f????^-一〇??t??-、,筒????X3k?〇?O??:Z,、、#?:??:?K-d呻??-W^/????f?/?’??2K?Cx?^-dim??图2.?2多个单词上下文的CBOW模型??Fig.?2.2?CBOW?Model?of?Multiple?Word?Contexts??输入层:由w;领域半径r内的文本单词{;q,;c2,…,xe}组成,单词是用One-Hot编码??表示输入,C为大小,7为词汇表的词汇数。??隐藏层:iV维的向量,输入向量利用FX/V维的权重矩阵W计算隐藏层。隐藏层的输??出计算/I是输入向量的加权平均。??h丄妒.([c?x?)??C?(“1?"?(2.6)??输出层:输出单词y,同样是用One-Hot编码方式表示,利用一个iVxK维的权重矩??阵VT计算输出层。输出层每个节点输入u;,其中是输出矩阵M/'的第/列。??w?=(v'?)?-h??J?V?(2.7)??,?、?exp(?w?.)?|??叉.,广叫…羚卜 ̄ ̄??>?exp?w?.??^J=l?V?W?(2.8)??权重矩阵W与14/用随机值进行初始化,使用反向传播(Back?Propagation,?BP)算法纠??正并更新权重矩阵。??(2)?Skip-gram?模型??Skip-gram模型与CBOW模型过程是相反的,给定中心词w;
大连海事大学硕士学位论文???seat?your?love?upon?a?precipice?because?it?is?high.”输入“upon”,窗口大小为?3,则输出是??{?“seat”,?“your”,“love”,“a”,“precipice”?/‘because’’},Skip-gram?模型架构如图?2.3?所示。??IIMF?UT?F*ROJHOTI〇M?OUTF?UX??我?w(l-2)??W(l>?i?\?^??Vs??SKip>gram??图2.?3?Skim-gram模型架构??Fig.?2.3?Skim-gram?Model?Architecture??多个单词的上下文的Skip-gram模型结构如图2.4所示。??〇?Output?layer??/卜??Input?layer?/?W?^???5I?-?,?l-lidden?layer/?n????'?^?'????**?°?h,?a?;<?w^-K?°??〇l?-?^?JV-dimS.?"?''?'x:?^?l〇j??r?aim?\w?SS??\j-??O*?f^dinn??图2.?4多个单词上下文的Skim-gram模型??Fig.?2.4?Skim-gram?Model?of?Multiple?Word?Contexts??输入层:单词w的One-Hot表示&,??隐藏层:隐藏层的输出/i利用y?x?iv维的权重矩阵w计算隐藏层。??h?=?xIW?=?'.:=vw!?(2?9)??输出层:上一层的输出yd,利用一个况XK维的权重矩阵14/'计算输出层。输??出层单词共享权重,故1^/=
【参考文献】:
期刊论文
[1]基于并行混合神经网络模型的短文本情感分析[J]. 陈洁,邵志清,张欢欢,费佳慧. 计算机应用. 2019(08)
[2]基于深度学习的社交网络平台细粒度情感分析[J]. 李阳辉,谢明,易阳. 计算机应用研究. 2017(03)
[3]基于领域情感词典的中文微博情感分析[J]. 肖江,丁星,何荣杰. 电子设计工程. 2015(12)
[4]中文微博情感词典构建方法[J]. 周咏梅,阳爱民,林江豪. 山东大学学报(工学版). 2014(03)
[5]基于HowNet的词汇语义倾向计算[J]. 朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德. 中文信息学报. 2006(01)
本文编号:3288953
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3288953.html
最近更新
教材专著