当前位置:主页 > 科技论文 > 软件论文 >

基于词向量概率模型的联合话题情感分析研究

发布时间:2019-10-24 01:46
【摘要】:互联网的迅速发展与普及给用户提供了很多便利。用户可以很方便地浏览和评论在线商品、服务以及新闻数据等网络信息。用户的评论信息一定程度上反映了用户对某一评论话题的情感态度,因此有效地分析和挖掘出用户的评论信息是非常有价值的。然而,目前针对在线评论信息的联合话题情感分析方法大都基于数据自身的属性,以单个词语为基本的处理单元,把每个词语看作一个单一的语义实体,基于词的共现统计规律进行相应的概率计算,忽略了文本中词语与词语之间的依赖关系,并且采用固定的情感词典,语义信息并不充分,很难有效表达复杂的语义关系,不能够满足实际的应用需求。针对这些问题,本文以用户的在线评论文本数据为研究对象,结合概率主题模型与词向量以及神经网络,提出了新的联合话题情感分析模型,可以同时地对文本进行话题识别和情感分析,主要工作包括以下两个部分:(1)提出弱监督的词向量联合话题情感分析模型(简称WS-TSWE)。大部分现有的联合话题情感分析模型主要根据词频统计进行相关概率的计算,当语料数较少或文本篇幅较短时,文本特征相对稀疏并且特征维度较高,这种单纯依靠词频统计进行话题和情感分配的方法往往会因为语义信息不足而造成情感分布和话题分布的结果不够理想;并且依赖特有领域的情感知识先验信息来识别语料中的正向和负向词,导致情感先验的影响受到限制,最终造成话题情感方面的情感分布结果不准确。针对这些问题,本文基于概率主题模型latent Dirichlet allocation(LDA),通过加入情感层,从外部扩展语料获取词语的外部词向量表示,利用伯努利分布将词频统计生成的情感话题-词分布与通过softmax函数得出的情感话题-词分布结合计算联合概率分布函数,进而训练得出情感话题-词的生成。在此基础上,模型进一步利用HowNet词典计算语料中每一个词的情感倾向,首先利用HowNet计算词的情感值,然后结合语料的上下文信息和模型训练不断更新情感值,提高了联合话题情感分析模型的准确性。(2)提出词向量依赖的联合话题情感分析模型(简称RTSWE)。弱监督的词向量联合话题情感分析模型(WS-TSWE)尽管扩展了词的语义信息,但是模型在生成词的过程中并没有充分考虑文本中词语与词语之间的依赖关系,使得每个词汇之间的语义信息相对独立。本文在(1)的基础上,利用(1)得出的情感-话题向量的结果,同时利用深度神经网络LSTM(Long short term)和GRU(Gated Recurrent Unit)的计算词语之间的长距离的依赖关系,最后计算在给定情感话题以及词序列依赖关系下生成词的概率,充分利用LSTM和GRU的特点,融入词语间的序列信息,扩展了词语与词语之间的依赖信息,进而丰富了词的语义信息,重新定义情感话题-词的分布,从而使得话题识别和情感分析的结果更加准确。
【学位授予单位】:深圳大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 杨洁;郑宁;徐海涛;刘董;徐明;;支持向量预选取的域着色Voronoi图方法[J];计算机应用与软件;2008年12期

2 李庆;胡捍英;;支持向量预选取的K边界近邻法[J];电路与系统学报;2013年02期

3 郑逢德;张鸿宾;;在线Lagrangian支撑向量回归[J];北京工业大学学报;2013年07期

4 赵春晖;张q,

本文编号:2552332


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2552332.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c00a9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com