当前位置:主页 > 社科论文 > 社会学论文 >

基于深度学习的对象级文本情感分析方法研究

发布时间:2021-07-09 09:23
  随着网民参与度的不断增高,互联网成为网民发表观点的集中平台,其聚集了大量表达网民观点的文本,成为宝贵的研究资源。研究网民对公众实体、产品、服务等方面的情感不仅有利于政府机构把握舆情态势并进一步辅助决策,而且具有极高的商业价值。近年来,深度学习在文本挖掘各项任务中均取得一定进展,对于文本情感分析这个文本挖掘中的热点与难点任务,研究如何使用深度学习的基本理论对文本表达的情感进行表示和提取,具有很高的理论意义和应用价值。本文围绕对象级文本情感分析的主要任务,根据不同数据特点,重点从针对微博热点话题数据的实体级文本情感分析和针对评论类数据的方面级文本情感分析两个方面展开研究,主要研究内容与创新点如下:1.提出了面向微博公众实体情感民调的实体级文本情感分析方法。针对微博热点话题数据,定义了面向公众实体情感民调的实体级微博文本情感分析任务,提出了基于序列标记的实体级文本情感分析方法,然后采用循环神经网络及其改进的循环单元进行序列标记,构建了用于实体级文本情感分析的中文微博热点话题数据集。数据统计结果表明采用序列标记的方式将文本中实体与情感联合表示的方法较传统串行方法具有明显优势,实验结果进一步表明... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:123 页

【学位级别】:博士

【部分图文】:

基于深度学习的对象级文本情感分析方法研究


产品评论示例

标记数据,元组,观点,评价指标


图 3.5 标记数据统计结果3.6.2 评价指标实体级微博文本情感分析的目的是提取<实体 E,情感 S>元组,因此本文采用F-Score 作为评价指标,令 RE 为正确提取的观点元组量,AE 是提取的所有观点元组量,AL 是所有标记的观点元组量,则 F-Score 的计算方法为:,REprecisionAE (3.33),RErecallAL (3.34)2* precision *recallF Scoreprecision recall 。 (3.35)3.6.3 实验设定[122][123]

情感分析,文本,实体


图 3.6 不同模型的实体级微博文本情感分析结果模型在深度增加后期的效果下降可能是由过拟合引起的,因为训练标记数据量较少,当深度增加时,模型参数随之增加,到达一定程度后会引起过拟合现象,使模型难以训练,效果也随之降低。4) 不同模型设定下最好结果。如表 3.4 所示,大多数最好结果的基本模型为GRU,并且不同循环单元模型的最好结果在模型变为双向和深层模型时均有较大提升。双向 GRU 在深度为 3 时取得了最好效果 0.736。最后,大多数的 RNN 模型取得了较基于情感打分的基本方法更好的效果,说明将观点中的实体和情感进行联合标记的方法对实体级微博文本情感分析更有效。表 3.4 不同模型设定下的最好结果最高 F-Score 基本模型 深度单层单向模型 0.675 GRU -单层双向模型 0.701 MGRU1 -多层单向模型 0.689 GRU 2多层双向模型 0.736 GRU 3

【参考文献】:
期刊论文
[1]面向产品特征的中文在线评论情感分类:以本体建模为方法[J]. 尹裴,王洪伟.  系统管理学报. 2016(01)
[2]使用机器学习对汉语评论进行情感分类[J]. 白鸽,左万利,赵乾坤,曲仁镜.  吉林大学学报(理学版). 2009(06)



本文编号:3273482

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/3273482.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e823c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com