面向网络评论短文本的情感分析研究与实现
发布时间:2021-03-05 19:18
随着互联网的快速发展,微博、贴吧、抖音等各种社交型网络平台对人们生活的影响越来越大,大量的网络用户在各种平台上会产生海量的信息,分析这些海量信息所隐藏的情感极性具有极大的商业和社会价值,因此对社交型网络平台的文本进行情感分析,已经成为当今的热点。在网络评论文本中,网络新词层出不穷,由于网络评论开放性的特点,表达相似语义的评论在不同背景语境下,情感极性都有可能发生改变。针对以上问题,本文提出了一套综合的网络评论文本的情感分析方法。本文具体的工作如下所示:(1)针对网络新词问题,本文建立了一套新词自动发现及情感识别系统。在新词发现的方面采用传统的基于统计的新词发现方法,该方法可以自动发现新词省去了大量的人工标注工作,在新词情感识别方面提出了一种基于新词上下文、情感词典基准词及新词分布式语义相似度的综合比较方法,来判断新词情感极性,最后自动建立了网络新词情感词典。(2)在网络评论背景多样性问题上,本文提出了一种基于背景增强的情感分类模型,该模型对评论进行情感分类的时候,将评论的相关新闻或帖子作为其背景,并将其作为评论文本情感分析的特征,加入到情感分类模型中,从而提高了模型在不同背景下情感分析...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【图文】:
前馈神经网络
?Xt?Xt-i??图2-9循环隐藏层??Figure?2-9?Loop?hidden?layer??图2-9是隐藏层(HidderLayer)层级展开图,t-l,t,t+l表示时间序列,X是输??入的样本&表示样本在t时刻的记忆,妒表示上一层记忆输入的权重,f;表示此刻??输入的样本的权重,F表示输出的样本权重。在t=l时刻,一般初始化输入知=0,??随机初始化%?R?F,进行下面的公式计算?_??hl=Uxl+?Ws0?(2-8)??st=m)?(2-9)??〇]?=g(^i)?(2-10)??其中,/、g均为激活函数/可以为tarLh、relu、sigmoid,而g—般为softmax也??可以是其他。以下时刻的状态时间就向前推进,此时的状态A作为时刻1的记忆状??态将参与下一个时刻的预测活动,也就是:??h2=Ux2+?JVs
重构并且以误差最小为目的来进行模型的训练,来得到包含句子结构信息的句子向量。假设句子s由m个单词5?=?(^,%,_..,1)的序个单词叫由〇1维向量嵌入冰=(+,;^...,&),如3.1小节所述。递归自标是基于句子及其相应的嵌入将句子映射到d维向量。??先将输入的所有词转换成分布式的向量表示每个词的是wxl?(其中置为300),整个模型由一系列自编码器块的串联组成。在每个自动父节点pi?(隐藏层)由两个子节点(输入层)计算:即句子中两个节点向量pi通过使用以下公式由两个子节点来计算:??A?=/(R[ci;c2]H)R中为编码矩阵其维度为wx2w,?^为偏置向量维度为wxl,f为函数一般采用tanh(〇。编码形成新的节点p然后用新的节点代替原,从而产生新的序列然后再选择相邻的词语依次进行编码,直到将成一个节点。??〇?_〇?_0?〇?〇_0??_??
【参考文献】:
期刊论文
[1]基于深度学习的文本表示方法[J]. 李枫林,柯佳. 情报科学. 2019(01)
[2]基于边界增强的中文直播弹幕新词发现[J]. 王雪瑞,刘渊. 传感器与微系统. 2018(07)
[3]基于改进的Prefixspan算法的中文文本新词提取方法研究[J]. 李博涵,蔡永香,邓舒颖,王督. 电脑知识与技术. 2018(08)
[4]面向社会媒体的开放领域新词发现[J]. 张华平,商建云. 中文信息学报. 2017(03)
本文编号:3065725
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【图文】:
前馈神经网络
?Xt?Xt-i??图2-9循环隐藏层??Figure?2-9?Loop?hidden?layer??图2-9是隐藏层(HidderLayer)层级展开图,t-l,t,t+l表示时间序列,X是输??入的样本&表示样本在t时刻的记忆,妒表示上一层记忆输入的权重,f;表示此刻??输入的样本的权重,F表示输出的样本权重。在t=l时刻,一般初始化输入知=0,??随机初始化%?R?F,进行下面的公式计算?_??hl=Uxl+?Ws0?(2-8)??st=m)?(2-9)??〇]?=g(^i)?(2-10)??其中,/、g均为激活函数/可以为tarLh、relu、sigmoid,而g—般为softmax也??可以是其他。以下时刻的状态时间就向前推进,此时的状态A作为时刻1的记忆状??态将参与下一个时刻的预测活动,也就是:??h2=Ux2+?JVs
重构并且以误差最小为目的来进行模型的训练,来得到包含句子结构信息的句子向量。假设句子s由m个单词5?=?(^,%,_..,1)的序个单词叫由〇1维向量嵌入冰=(+,;^...,&),如3.1小节所述。递归自标是基于句子及其相应的嵌入将句子映射到d维向量。??先将输入的所有词转换成分布式的向量表示每个词的是wxl?(其中置为300),整个模型由一系列自编码器块的串联组成。在每个自动父节点pi?(隐藏层)由两个子节点(输入层)计算:即句子中两个节点向量pi通过使用以下公式由两个子节点来计算:??A?=/(R[ci;c2]H)R中为编码矩阵其维度为wx2w,?^为偏置向量维度为wxl,f为函数一般采用tanh(〇。编码形成新的节点p然后用新的节点代替原,从而产生新的序列然后再选择相邻的词语依次进行编码,直到将成一个节点。??〇?_〇?_0?〇?〇_0??_??
【参考文献】:
期刊论文
[1]基于深度学习的文本表示方法[J]. 李枫林,柯佳. 情报科学. 2019(01)
[2]基于边界增强的中文直播弹幕新词发现[J]. 王雪瑞,刘渊. 传感器与微系统. 2018(07)
[3]基于改进的Prefixspan算法的中文文本新词提取方法研究[J]. 李博涵,蔡永香,邓舒颖,王督. 电脑知识与技术. 2018(08)
[4]面向社会媒体的开放领域新词发现[J]. 张华平,商建云. 中文信息学报. 2017(03)
本文编号:3065725
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3065725.html