面向社交网络文本的情绪分析方法研究

发布时间:2021-03-31 07:25
  随着互联网技术与社交网络平台的迅猛发展,人们通过网络发表观点、分享信息,产生了大量含有情绪信息的文本数据。这些数据中蕴藏着丰富的社会价值与商业价值,吸引了众多学者对文本情绪分析研究的关注。但由于网络文本大多篇幅较短且形式多样,使得情绪分析工作变得较为困难。另外,伴随文化交流的日益增加,多种语言混合的表达方式也被广泛应用在知乎、微博、Twitter等网络平台。若将此类文本转换为同种语言进行情绪分析,可能会造成语义变化、信息丢失等问题。为此,本文对句子级文本以及中英文混合文本的情绪分析方法展开深入研究,主要工作分为以下两个方面:(1)提出基于情绪认知模型(OCC模型)和贝叶斯网络的情绪句分类方法。本文从认知心理学的角度分析OCC模型的情绪生成过程,从中提取一组情绪评估变量,并通过对文本进行句法、语义分析,提出基于语义关系的情绪评估变量赋值算法。为避免句中信息缺失所带来的影响,本文将情绪评估变量作为贝叶斯网络的节点并结合表情符号特征,经结构、参数学习得到情绪分类贝叶斯网络(ECBN)。在公开评测数据集上进行实验,结果表明在添加表情特征后,宽松标准与严格标准条件下的平均精度分别提升5.5%、4... 

【文章来源】:郑州大学河南省 211工程院校

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

面向社交网络文本的情绪分析方法研究


情绪生成规则示例图

过程图,过程,决策面,维空间


图 2.2 联合树的建立过程基本思想是通过在样本面能将不同类别的数据的决策面为直线 A,右线,即它们在二维空间射至三维空间再次寻找核函数可在一定程度上据映射至高维空间中,

线性可分,线性不可分


该平面能将不同类别的数据点分隔开以实现分类。如图2.3 所示,左图(a)中数据的决策面为直线 A,右图(b)中显示的数据无法找到能够将其划分为两类的直线,即它们在二维空间中是非线性可分的,对于这种情况则需要将这些数据映射至三维空间再次寻找决策面。当空间维数过高时会带来庞大的计算量,引入核函数可在一定程度上缓解计算困难,它能将低维空间中非线性可分的两类数据映射至高维空间中,使其变得线性可分。(a) (b)图 2.3 线性可分与线性不可分

【参考文献】:
期刊论文
[1]多语言文本情绪分析模型MF-CSEL[J]. 徐源音,柴玉梅,王黎明,刘箴.  小型微型计算机系统. 2019(05)
[2]文本情绪分析综述[J]. 李然,林政,林海伦,王伟平,孟丹.  计算机研究与发展. 2018(01)
[3]一种基于OCC模型的文本情感挖掘方法[J]. 皇甫璐雯,毛文吉.  智能系统学报. 2017(05)
[4]Twitter推文与情感词典SentiWordNet匹配算法研究[J]. 易顺明,周洪斌,周国栋.  南京师范大学学报(工程技术版). 2016(03)
[5]基于双语词典的微博多类情感分析方法[J]. 栗雨晴,礼欣,韩煦,宋丹丹,廖乐健.  电子学报. 2016(09)
[6]基于同义词词林信息特征的语义角色自动标注[J]. 李国臣,吕雷,王瑞波,李济洪,李茹.  中文信息学报. 2016(01)
[7]代价敏感分类算法的实验比较[J]. 闫明松,周志华.  模式识别与人工智能. 2005(05)
[8]情绪研究中的若干问题综述[J]. 石林.  心理学动态. 2000(01)
[9]汉语自动分词研究中的苦干理论问题[J]. 孙茂松,邹嘉彦.  语言文字应用. 1995(04)
[10]情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美.  情报学报. 2008 (02)

硕士论文
[1]基于OCC模型的文本情感识别方法的研究[D]. 庞娜.太原理工大学 2008



本文编号:3111046

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3111046.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c8e2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com