面向网络评论短文本的情感分析研究与实现

发布时间：2021-03-05 19:18

　　随着互联网的快速发展,微博、贴吧、抖音等各种社交型网络平台对人们生活的影响越来越大,大量的网络用户在各种平台上会产生海量的信息,分析这些海量信息所隐藏的情感极性具有极大的商业和社会价值,因此对社交型网络平台的文本进行情感分析,已经成为当今的热点。在网络评论文本中,网络新词层出不穷,由于网络评论开放性的特点,表达相似语义的评论在不同背景语境下,情感极性都有可能发生改变。针对以上问题,本文提出了一套综合的网络评论文本的情感分析方法。本文具体的工作如下所示:（1）针对网络新词问题,本文建立了一套新词自动发现及情感识别系统。在新词发现的方面采用传统的基于统计的新词发现方法,该方法可以自动发现新词省去了大量的人工标注工作,在新词情感识别方面提出了一种基于新词上下文、情感词典基准词及新词分布式语义相似度的综合比较方法,来判断新词情感极性,最后自动建立了网络新词情感词典。（2）在网络评论背景多样性问题上,本文提出了一种基于背景增强的情感分类模型,该模型对评论进行情感分类的时候,将评论的相关新闻或帖子作为其背景,并将其作为评论文本情感分析的特征,加入到情感分类模型中,从而提高了模型在不同背景下情感分析...

【文章来源】：北京交通大学北京市 211工程院校教育部直属院校

【文章页数】：64 页

【学位级别】：硕士

【图文】：

面向网络评论短文本的情感分析研究与实现

前馈神经网络

链式结构,样本,权重,隐藏层

?Ｘｔ?Ｘｔ－ｉ??图２－９循环隐藏层??Ｆｉｇｕｒｅ?２－９?Ｌｏｏｐ?ｈｉｄｄｅｎ?ｌａｙｅｒ??图２－９是隐藏层（ＨｉｄｄｅｒＬａｙｅｒ）层级展开图，ｔ－ｌ，ｔ，ｔ＋ｌ表示时间序列，Ｘ是输??入的样本＆表示样本在ｔ时刻的记忆，妒表示上一层记忆输入的权重，ｆ；表示此刻??输入的样本的权重，Ｆ表示输出的样本权重。在ｔ＝ｌ时刻，一般初始化输入知＝０，??随机初始化％?Ｒ?Ｆ，进行下面的公式计算？＿??ｈｌ＝Ｕｘｌ＋?Ｗｓ０?（２－８）??ｓｔ＝ｍ）?（２－９）??〇］?＝ｇ（＾ｉ）?（２－１０）??其中，／、ｇ均为激活函数／可以为ｔａｒＬｈ、ｒｅｌｕ、ｓｉｇｍｏｉｄ，而ｇ—般为ｓｏｆｔｍａｘ也??可以是其他。以下时刻的状态时间就向前推进，此时的状态Ａ作为时刻１的记忆状??态将参与下一个时刻的预测活动，也就是：??ｈ２＝Ｕｘ２＋?ＪＶｓ

序列,自编码,递归

重构并且以误差最小为目的来进行模型的训练，来得到包含句子结构信息的句子向量。假设句子ｓ由ｍ个单词５?＝?（＾，％，＿．．，１）的序个单词叫由〇１维向量嵌入冰＝（＋，；＾．．．，＆），如３．１小节所述。递归自标是基于句子及其相应的嵌入将句子映射到ｄ维向量。??先将输入的所有词转换成分布式的向量表示每个词的是ｗｘｌ?（其中置为３００），整个模型由一系列自编码器块的串联组成。在每个自动父节点ｐｉ?（隐藏层）由两个子节点（输入层）计算：即句子中两个节点向量ｐｉ通过使用以下公式由两个子节点来计算：??Ａ?＝／（Ｒ［ｃｉ；ｃ２］Ｈ）Ｒ中为编码矩阵其维度为ｗｘ２ｗ，?＾为偏置向量维度为ｗｘｌ，ｆ为函数一般采用ｔａｎｈ（〇。编码形成新的节点ｐ然后用新的节点代替原，从而产生新的序列然后再选择相邻的词语依次进行编码，直到将成一个节点。??〇?＿〇?＿０?〇?〇＿０??＿??

【参考文献】：
期刊论文
[1]基于深度学习的文本表示方法[J]. 李枫林,柯佳.  情报科学. 2019(01)
[2]基于边界增强的中文直播弹幕新词发现[J]. 王雪瑞,刘渊.  传感器与微系统. 2018(07)
[3]基于改进的Prefixspan算法的中文文本新词提取方法研究[J]. 李博涵,蔡永香,邓舒颖,王督.  电脑知识与技术. 2018(08)
[4]面向社会媒体的开放领域新词发现[J]. 张华平,商建云.  中文信息学报. 2017(03)

本文编号：3065725

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3065725.html

上一篇：智能生产与仓储管理系统程序设计与实现
下一篇：图像水印技术的研究与应用

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|