当前位置:主页 > 管理论文 > 统计学论文 >

基于Capsule Network的多源新闻评论细粒度情感分析

发布时间:2021-09-29 19:25
  伴随着移动互联网以及智能终端设备普及范围的不断扩大,读者获取新闻资讯的途径越来越丰富,在这样的背景下移动新闻客户端成为了读者最主要的新闻获取渠道之一,相较于报纸、电视等传统新闻媒介,其优势是新闻媒体与读者双方的互动更为密切,具体表现为读者在阅读新闻后通常会以发表评论的方式反馈自己的看法,同时媒体也会通过发起投票等形式主动获取读者的情感态度。为了帮助新闻媒体更便捷地获取读者的情绪反馈,同时尽可能多地挖掘出读者评论中蕴含的价值,本文希望能够找到一种有效的自动情感挖掘方式。文本情感分析的方法多种多样,从依靠情感词典及句法结构,到依赖人工挑选特征的机器学习方法,再到实现了自动特征提取的深度学习方法,文本情感挖掘工作越来越高效且准确性不断提升。本文分析并总结了读者情绪分析的研究现状,结合目前深度学习领域新提出的胶囊神经网络模型,深入研究了对由新闻引发的读者情绪进行自动判别的方法,主要工作内容包括:第一,本文摒弃了传统“非褒即贬”的二分类方法,综合考虑常用的文本情感划分方式及真实新闻评论数据集的情感分布特点,最终确定将读者评论划分为“愤怒”、“悲伤”、“支持”、“其他”四个类别。第二,本文融合了读... 

【文章来源】:上海师范大学上海市

【文章页数】:54 页

【学位级别】:硕士

【部分图文】:

基于Capsule Network的多源新闻评论细粒度情感分析


技术路线图

过程图,胶囊,动态路由,神经网络


上海师范大学硕士学位论文第3章改进动态路由的胶囊神经网络模型16的信息损失也较为严重,于是胶囊神经网络摒弃了池化结构,在网络间采用动态路由的方式有选择地进行特征传递,增大相似度高的高层特征与低层特征之间的连接强度,实现对于不同类别特征的区别对待,很大程度上减少了有效信息的损失。胶囊神经网络在各层网络间的特征传递方式如图3-1所示:图3-1胶囊神经网络中的动态路由过程其中iu为低层网络中的向量胶囊,jv为高层网络中的胶囊,实际上jv可以看作是iu的聚类中心,而动态路由实则是基于聚类思想实现的特征整合,实现由低层胶囊到高层胶囊的非线性映射。3.1.2模型结构为了使胶囊神经网络能够应用于自然语言处理任务中,本文修改了其网络结构,初步构建的胶囊神经网络模型由5层网络构成,下面将分别对这5部分进行详细介绍说明。1.N-gram卷积层胶囊神经网络中的第一层为N-gram卷积层,用于初步提取文本的局部特征。本文使用了与TextCNN相同的特征提取方式,即通过使用几种不同窗口大小的滤波器来提取文本词向量矩阵的N-gram特征,目的在于获取不同粒度大小的语义信息。假设LVXR表示输入语句的词向量矩阵,其中L是句子的长度,V是词向量的维度,ViXR为句子中第i个词对应的V维词向量,N-gram卷积层中用于

分布情况,情感,类别,数据集


上海师范大学硕士学位论文第4章多源新闻评论细粒度情感分析27这两类情感同“无情绪”类一同归入“其他”类别中。在进行初步合并后发现,由于评论文本较为简短,绝大部分仅表达单一情感,但也存在部分评论能够反映读者的多种情绪。在本文采集的一万条评论数据中有9072条表达了上述四类情感中的一种,同时有928条评论表达了两种及以上情感,表4-2对这类带有多重情感标签的评论进行了展示:表4-2表达多种情感的评论文本样例评论文本情感类别看到他的生活环境不禁泪目,中国有如此少年何愁国不富民不强悲伤、支持拐卖孩子罪无可恕!孩子才这么小太让人心疼了愤怒、悲伤一个男人打护士你好意思的吗!支持民警拘留他!愤怒、支持于是本文最终确定将新闻评论划分为“支持”、“愤怒”、“悲伤”、“其他”这四个类别,本文所使用的评论数据集的情感类别分布情况如图4-1所示图4-1读者评论数据集情感类别分布由图4-1可以看出,除了“其他”类别外,其余三个类别的占比较为平均,在30%左右,“其他”这一类别中包含了“恐惧”、“惊讶”、“无情绪”三类情感,其中“恐惧”与“惊讶”占比较小,“无情绪”类占全部“其他”类样本的95.7%。

【参考文献】:
期刊论文
[1]基于CapsNet的中文文本分类研究[J]. 冯国明,张晓冬,刘素辉.  数据分析与知识发现. 2018(12)
[2]基于Word2Vec的情感词典自动构建与优化[J]. 杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦.  计算机科学. 2017(01)
[3]基于语义约束LDA的商品特征和情感词提取[J]. 彭云,万常选,江腾蛟,刘德喜,刘喜平,廖国琼.  软件学报. 2017(03)
[4]基于依存句法的博文情感倾向分析研究[J]. 冯时,付永陈,阳锋,王大玲,张一飞.  计算机研究与发展. 2012(11)
[5]基于语义理解的文本情感分类方法研究[J]. 闻彬,何婷婷,罗乐,宋乐,王倩.  计算机科学. 2010(06)

硕士论文
[1]基于依存句法的句子级细粒度情感计算[D]. 赵黎光.华南理工大学 2015



本文编号:3414325

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3414325.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7d349***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com