细粒度文本情感分析问题研究
发布时间:2021-08-28 09:43
随着在线社交网络的兴起,大量的用户在互联网上发表文字表达自己的情感,其中既包含对生活、事件的情绪抒发,又包含对产品各个方面的使用体验和评价。这些情感表达为文本情感分析研究提供了数据基础。文本情感分析研究人们在文本中表达的情感、态度、观点、情绪。细粒度情感分析是其中一个细分领域,研究细粒度的情感。细粒度情感分析在任务定义上、数据准备上、方法有效性上,依然面临着很多困难和挑战。首先,针对细粒度情感极性的文本情绪分类研究,可用于抽取文本中的情绪,相关研究在舆情监控中有较大的应用价值。此前的情绪分类研究假设了文本中只有一种情绪,本文发现了社交网络文本中包含多种情绪的现象。如何识别文本包含的所有情绪种类,尤其针对短文本的场景,是具有挑战的。其次,如何将多种情感和方面对应起来,此为方面级情感分析问题,这是针对细粒度情感对象的研究,它可进一步分为两类:针对方面词和针对方面类别的情感分析。如何设计统一的方法,同时解决两种方面级情感分析问题具有挑战性。此外,方面级情感分析研究假设了文本中仅包含一种实体,然而社交网络中,存在对多个实体、多个方面表达出多种情感的现象,如何有效建模、如何设计方法解决该问题也存...
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:129 页
【学位级别】:博士
【部分图文】:
图1.1:情感分析常见研宄问题??
图1.3:论文主要工作与组织结构关系图??期记忆网络建模上下文表示,利用多轮更新优化实体和方面表示,并最终预测??情感。实验表明该方法的效果显著优于基线方法。进一步研宄表明,本文的方??法在训练数据匮乏的(实体,方面)组合上表现出出色的结果,意味着实际应??用中,数据标注工作可以大幅简化。??第六章进一步研宂实体方面级情感分析。相关研宄表明,多种端到端的深??度学习模型在复杂文本上效果表现均不理想。本文针对这一挑战,提出把依??存句法分析技术和端到端的深度学习相结合,构建了?DT-CEA算法。DT-CEA??算法的主要思想是引入了基于依存树的距离,使得基于位置的注意力层可以??有效解决长插入语、长定语造成的注意力分配偏差;同时,借鉴了依存桥的思??想,构建了依存门,控制依存信息的保留程度,通过对依存连接关系、依存方??向、依存类型的建模,修改了?LSTM算法中的隐藏层节点计算机制。实验表明,??DT-CEA将依存句法信息融入模型,可以有效地提升效果。尤其是在复杂文本??上和长文本上,DT-CEA的优势格外明显。??
Ut?=?WhyK?+?by?(2.15)??其中丨V和b是参数,//是隐藏层的计算函数。图2.3是循环神经网络结构示意??图。??循环神经网络存在梯度消失和梯度爆炸问题,研究者们设计了很多变体,??例如门控循环单元(GRU)?[89]、长短期记忆网络(LSTM)丨90]等,以及他们??的多层、双向变体。??2.2.2门控循环单元??门控循环单兀(Gated?Recurrent?Unit,GRU)是循环神经网络的一种变体,??21??
【参考文献】:
期刊论文
[1]基于表情符注意力机制的微博情感分析模型[J]. 谭皓,邓树文,钱涛,姬东鸿. 计算机应用研究. 2019(09)
[2]融合Bi-LSTM和位置关系的对象级情感分析[J]. 鲍豪,李少童. 信息系统工程. 2018(03)
[3]一种用于基于方面情感分析的深度分层网络模型[J]. 刘全,梁斌,徐进,周倩. 计算机学报. 2018(12)
[4]面向变异短文本的快速聚类算法[J]. 黄永光,刘挺,车万翔,胡晓光. 中文信息学报. 2007(02)
本文编号:3368278
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:129 页
【学位级别】:博士
【部分图文】:
图1.1:情感分析常见研宄问题??
图1.3:论文主要工作与组织结构关系图??期记忆网络建模上下文表示,利用多轮更新优化实体和方面表示,并最终预测??情感。实验表明该方法的效果显著优于基线方法。进一步研宄表明,本文的方??法在训练数据匮乏的(实体,方面)组合上表现出出色的结果,意味着实际应??用中,数据标注工作可以大幅简化。??第六章进一步研宂实体方面级情感分析。相关研宄表明,多种端到端的深??度学习模型在复杂文本上效果表现均不理想。本文针对这一挑战,提出把依??存句法分析技术和端到端的深度学习相结合,构建了?DT-CEA算法。DT-CEA??算法的主要思想是引入了基于依存树的距离,使得基于位置的注意力层可以??有效解决长插入语、长定语造成的注意力分配偏差;同时,借鉴了依存桥的思??想,构建了依存门,控制依存信息的保留程度,通过对依存连接关系、依存方??向、依存类型的建模,修改了?LSTM算法中的隐藏层节点计算机制。实验表明,??DT-CEA将依存句法信息融入模型,可以有效地提升效果。尤其是在复杂文本??上和长文本上,DT-CEA的优势格外明显。??
Ut?=?WhyK?+?by?(2.15)??其中丨V和b是参数,//是隐藏层的计算函数。图2.3是循环神经网络结构示意??图。??循环神经网络存在梯度消失和梯度爆炸问题,研究者们设计了很多变体,??例如门控循环单元(GRU)?[89]、长短期记忆网络(LSTM)丨90]等,以及他们??的多层、双向变体。??2.2.2门控循环单元??门控循环单兀(Gated?Recurrent?Unit,GRU)是循环神经网络的一种变体,??21??
【参考文献】:
期刊论文
[1]基于表情符注意力机制的微博情感分析模型[J]. 谭皓,邓树文,钱涛,姬东鸿. 计算机应用研究. 2019(09)
[2]融合Bi-LSTM和位置关系的对象级情感分析[J]. 鲍豪,李少童. 信息系统工程. 2018(03)
[3]一种用于基于方面情感分析的深度分层网络模型[J]. 刘全,梁斌,徐进,周倩. 计算机学报. 2018(12)
[4]面向变异短文本的快速聚类算法[J]. 黄永光,刘挺,车万翔,胡晓光. 中文信息学报. 2007(02)
本文编号:3368278
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3368278.html
最近更新
教材专著