融合双层注意力机制的短文本情感分析模型

发布时间:2021-01-10 22:57
  短文本情感分类一直是信息处理领域中极具挑战性的问题。与文档级别的文本不同,短文本由于其自身的诸多特性:(1)短文本包含有限的上下文语境,并且语义表达往往不完整;(2)许多用户生成文本(UGC)如搜索查询,微博等短文本,并不总是很好地遵循书面语言的语法[1]。造成传统机器学习方法对其分析效果不是很理想。传统机器学习模型一般通过向量空间模型对短文本进行表示,通过文本特征扩展对分类效果进行优化,以此提高对短文本分类的效果[2-3]。但由于短文本一般都是句子级别的文本,大多存在语料简短,数据稀疏等问题,传统机器学习的性能往往表现一般。因此,本文采用深度学习的方法对短文本进行情感分析。本文的研究内容概括如下:(1)通过对当前短文本情感分析领域的前沿发展分析可知,基于深度学习的方法以其特征的自学习特性,在短文本情感分析问题上表现良好。本文在现有基于深度学习的短文本情感分析的研究基础上,我们研究发现:1)一部分短文本中包含一个或多个与该短文本实际表达的情感不一致或差异较大的词,我们称之为“干扰词”。这种“干扰词”在一定程度上干扰深度模型的判断,导致深度模型... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

融合双层注意力机制的短文本情感分析模型


基于机器学习的文本分类框架

框架图,文本分类,框架,情感倾向


图 2-1 基于机器学习的文本分类框架学习的短文本情感分析框架分类指的是文本长度为句子级别的文本。假定给定一个句子感分析就是要判定该句子的情感倾向,情感倾向可以是两类+代表积极情感倾向, 代表消极情感倾向,0 代表中性情感领域,句子级别文本情感分析整体框架可以分为 3 个部分,中的每个词语进行表示;第二部分就是选择合适的神经网络分就是通过 softmax 作为分类器对文本给出一个分类标签。

模型结构,袋模,表示上下文,训练模型


= ′ ∑ ′ ∈表示上下文信息: = ,袋模型中,就直接吧隐藏层去掉,大大减少了计算量,提高了计数据训练模型,最后的效果也不错。文本训练 ,…, ,连续词袋模型的目标函数为: = 1 ( | )模型的结构如图 2-3 所示:

【参考文献】:
期刊论文
[1]基于深度学习的短文本评论产品特征提取及情感分类研究[J]. 李杰,李欢.  情报理论与实践. 2018(02)
[2]神经网络中的注意力机制[J]. Adam Kosiorek.  机器人产业. 2017(06)
[3]基于注意力机制的微博情感分析[J]. 周瑛,刘越,蔡俊.  情报理论与实践. 2018(03)
[4]基于特征扩展与深度学习的短文本情感判定方法[J]. 杜永萍,陈守钦,赵晓铮.  计算机科学. 2017(10)
[5]基于多维扩展特征与深度学习的微博短文本情感分析[J]. 孙晓,彭晓琪,胡敏,任福继.  电子与信息学报. 2017(09)
[6]基于机器学习的商品评论情感分析模型研究[J]. 赵刚,徐赞.  信息安全研究. 2017(02)
[7]网络情感词自动识别方法研究[J]. 张清亮,徐健.  现代图书情报技术. 2011(10)

硕士论文
[1]基于深度学习的文本情感分类研究[D]. 朱少杰.哈尔滨工业大学 2014



本文编号:2969572

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2969572.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2b196***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com