基于深度学习的特定目标情感分类研究

发布时间:2021-10-10 18:42
  特定目标情感分类(aspect-based sentiment analysis,ABSA)是情感分类领域中的一项基础任务,它的主要任务是在给定目标实体的情况下对短语或者文本进行情感分类。在早期完成此任务一般采用基于情感词典的方法及浅层机器学习的方法。近几年,随着深度学习的快速发展,大部分研究者更专注于采用深度学习的方法。基于深度学习的方法大致可以分为两步:第一步将需要分类的短语或文本转化为词向量(word vector)。第二步利用神经网络来对转化好的信息进行分类。在第一步中由于词向量的训练需要庞大的数据集,所以以往基于深度学习的方法都没有花大量的时间在训练词向量上,而是直接使用深度学习框架预训练好的词向量,但这些词向量集并不能全体覆盖都有的词语,且不同语境下的词语也会有不同的上下文关系,导致预训练词向量的鲁棒性不强。在第二步中,如何更准确的确定目标实体与情感词之间的关系,一直都是特定目标情感分类待优化的问题。此外长文本的上下文语义难以得到准确的保存问题依旧存在。为了提高预训练的鲁棒性及分类的准确性,本文做了如下的主要研究工作:首先针对预训练词向量的鲁棒性的问题,提出对预训练后的词向... 

【文章来源】:湘潭大学湖南省

【文章页数】:48 页

【学位级别】:硕士

【部分图文】:

基于深度学习的特定目标情感分类研究


电影《逃学威龙》影评

商品,平台,情感


2在进行网络购物时,所看到的商品完全是虚拟化的,过于抽象,无法真实的了解到商品的质量及规格等,这使得在线评论成为了消费者了解及是否购买商品的重要参考评价之一,起着参考性甚至决定性的作用。不仅如此,这些在线评论对于商家而言也是非常重要的评价指标。所以通过细粒度的情感分析得到相应产品指标的情感,于商家,可作为商家产品改进及商家决定主打产品的指导方向;于消费者,可通过各项产品指标快速定位到自己所需的产品。图1.2某电商平台的商品评价在信贷风控领域,如何能准确且及时的发现信贷风险是一个长久以来的问题。传统信贷风控通过填表、走访等方式来收集信贷对象的相关信息,形成内部结构化的数据,再利用传统的金融模型进行分析。但由于内部机构化的数据蕴含的数据价值有限,传统信贷风控的效果遇到了瓶颈。随着大数据时代的到来,互联网上所蕴含有价值的信息越来越多,于是越来越多的目光开始聚集在互联网的信息上,信贷公司希望能通过互联信息网筛选出相关目标的舆情信息,以结合传统信贷风控提高风控效果。但互联网信息不仅多而杂,且更新速度极快,人工的筛选显得乏力,所以更多的信贷公司会选择结合人工筛选与人工智能的方式来进行,以在减少人工投入的情况下,更准确、更及时的获取相关信息,而人工智能主要体现在基于特定目标情感分类上。近几年,对于基于特定目标情感分类应用场景越来越多,远不止上述,尽管当前的分类技术正在蓬勃发展,但由于自然语言的复杂且灵活,如何能更准确的让机器理解自然语言,从而更准确的进行情感分类依旧具有着重要的研究意义。1.2特定目标情感分类的难点特定目标情感分类旨在利用自然语言处理技术,在给定特定目标实体的情况下,分析短语或文本的情感倾向,但由于自然语言的复杂?

结构图,情感,向量,目标


17=((|,))(3.1)(|,)=(+)(3.2)其中与都是可训练的参数,为权重,为偏置,为最终预计。本文所用损失函数为gluon自带的softmax与交叉熵函数(SoftmaxCrossEntropyLoss),所以上述公式中,模型只包含交给softmax结果的训练部分。图3.1WV-LRC特定目标情感分类模型总体结构图3.2词向量微调尽管预训练的词向量是通过大量的语意语料训练出来的,但并不一定适合所有的情感分类任务数据,在WV-LRC模型的输入层中,本文加入了一个词向量微调操作,具体实现为:在嵌入词向量后,再将所有词向量分别输入一个以作为激活函数的全连接层,得到新的词向量。本文认为在不同的数据集上,不同的词语语境会有所变化,这时预训练好的词向量在不同的数据集上表现就会有所不同,即预训练的词向量鲁棒性有待提高。本文采用一层以为激活函数的全连接层对词向量嵌入后的结果再次进行调整,使其在训练分类模型的同时微小的调整词向量,以提高词向量在不同数据集上的鲁棒性。本文在后续实验中有对是否使用词向量微调进行了对比实验,实验结果表明词向量的微调可以提高模型对特定目标情感分类的准确性。

【参考文献】:
期刊论文
[1]Twitter情感分析中停用词处理[J]. 高巍,孙盼盼,李大舟.  计算机工程与设计. 2019(11)
[2]基于朴素贝叶斯的文本情感分类及实现[J]. 梁柯,李健,陈颖雪,刘志钢.  智能计算机与应用. 2019(05)
[3]基于支持向量机的网络评论情感分析方法[J]. 程正双,王亮.  电子技术与软件工程. 2019(16)
[4]自然语言处理发展及应用综述[J]. 赵京胜,宋梦雪,高祥.  信息技术与信息化. 2019(07)
[5]基于Word2vec和多分类器的影评情感分类方法[J]. 王学贺,赵华.  宁夏大学学报(自然科学版). 2019(02)
[6]基于朴素贝叶斯的细粒度意见挖掘[J]. 刘丽.  物联网技术. 2019(06)
[7]基于LSTM和多特征组合的电影评论专业程度分类[J]. 吴璠,李寿山,周国栋.  计算机科学. 2019(S1)
[8]情感分析在商品评论中的应用[J]. 张明辉.  现代信息科技. 2019(10)
[9]一种基于支持向量机和主题模型的评论分析方法[J]. 陈琪,张莉,蒋竞,黄新越.  软件学报. 2019(05)
[10]基于RNTN和CBOW的商品评论情感分类[J]. 彭三春,张云华.  计算机工程与设计. 2018(03)

硕士论文
[1]企业互联网负面信息抓取研究[D]. 王倪东.湘潭大学 2018



本文编号:3428941

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3428941.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户45faf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com