基于深度学习的文本情绪原因发现方法的研究与实现
发布时间:2021-01-25 17:09
随着互联网的飞速发展,人们越来越多地在网络媒体上阐述自己的观点,并表达自己的情绪。在这种背景之下,互联网中包含情绪倾向和观点倾向的文本数据呈现爆炸性的增长。这些文本信息具有非凡的价值,它经常包括发表人的情绪和观点,有助于人们从中提取每一个人的兴趣点与关注点。近年来,人们经常会从文本中的情感信息用于进行决策。近年来,人们还开始利用文本中的情感信息,提取情绪发生的原因。情绪原因提取主要目标使从文本中识别某种情绪表达背后的原因。本文主要研究并实现基于深度学习的情绪原因发现方法。通过深度学习的方法建立情感词与文本中的句子之间的关系,并以此识别文本中的情绪原因。在以往的研究中,基于深度学习的方法通常是去准确地获取情感词与文本中句子之间的语义相关性,并依此来识别文本中的情感原因。本文主要分为四方面内容:(1)针对目前情绪原因发现问题的语料较小,若采用一些相对复杂的深度网络,往往容易过拟合。本文采用了一种新的情绪原因半自动标注方法,扩充了一倍的数据集,并利用目前Gui提出的基于记忆网络的深度模型验证了数据有效性。(2)针对目前情绪原因发现方法只采用了互注意力机制,只考虑了情感词与文本子句之间的关系而...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图2-1?CBOW和Skip-Gram模型结构图??CBOW模型的目标是利用己知的上下文词向量来预测目标词词的出现概率,由??CBOW经,一,
一个子句是否为产生该情感的原因。本文的原始数据来自腾讯新闻,作者通过搭??建爬虫程序,爬取了?2018年3-6月共30000篇新闻文章,并且保留文章标题、??正文和日期。本文使用的半自动标注方法流程如图3-1:??■躺?。■文本■词5、,J极職'德1^??图3-1半自动标注流程图??通过观察原始语料,作者发现很多原始语料中只表达新闻事件本身,新闻中??的主人公并未表达情绪,新闻中也没有表现出明显的情绪倾向。像这一类文本是??不符合情绪原因发现问题的标注要求的。作为情绪原因发现问题的标准文本,应??是带有情绪的文章。因此需要有一种方法来对包含情绪的语料进行筛选。在本文??中,笔者利用情绪极性分类的方式来筛选文本。??情绪文本提取步骤如下:1.本文直接使用了?LSTM作为训练算法,通过评论??极性数据集训练出了一个情绪极性分类模型,把文章分为正极性和负极性。模型??16??
前己经存在表中的情绪文本和原因,用户操作表用于存储用户提交的情绪文本和??结果,用户日志表用于记录系统用户提交的模型更新,模型路径表用户存储模型??的存储路径。如图5-2为本系统数据库设计的E-R图。??|??!??36??
本文编号:2999581
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图2-1?CBOW和Skip-Gram模型结构图??CBOW模型的目标是利用己知的上下文词向量来预测目标词词的出现概率,由??CBOW经,一,
一个子句是否为产生该情感的原因。本文的原始数据来自腾讯新闻,作者通过搭??建爬虫程序,爬取了?2018年3-6月共30000篇新闻文章,并且保留文章标题、??正文和日期。本文使用的半自动标注方法流程如图3-1:??■躺?。■文本■词5、,J极職'德1^??图3-1半自动标注流程图??通过观察原始语料,作者发现很多原始语料中只表达新闻事件本身,新闻中??的主人公并未表达情绪,新闻中也没有表现出明显的情绪倾向。像这一类文本是??不符合情绪原因发现问题的标注要求的。作为情绪原因发现问题的标准文本,应??是带有情绪的文章。因此需要有一种方法来对包含情绪的语料进行筛选。在本文??中,笔者利用情绪极性分类的方式来筛选文本。??情绪文本提取步骤如下:1.本文直接使用了?LSTM作为训练算法,通过评论??极性数据集训练出了一个情绪极性分类模型,把文章分为正极性和负极性。模型??16??
前己经存在表中的情绪文本和原因,用户操作表用于存储用户提交的情绪文本和??结果,用户日志表用于记录系统用户提交的模型更新,模型路径表用户存储模型??的存储路径。如图5-2为本系统数据库设计的E-R图。??|??!??36??
本文编号:2999581
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2999581.html