基于混合词向量方法的细粒度短文本情感分析的研究
发布时间:2021-04-18 08:54
短文本情感分析是自然语言处理的热点研究方向之一。使用基于深度学习的方法捕捉潜藏于文本的情感信息,是目前较为流行的一种短文本情感分析方法,但是它依赖数据集,在处理细粒度情感分析任务时准确率较低。基于情感词表与规则的方法常用于长文本分析。将这种方法引入细粒度短文本分析任务中,简称为混合词向量方法,利用情感词表能提取部分文本特征的特点,针对词向量语义稀疏的问题,改善词向量对文本的描述能力,提高细粒度短文本情感分析的准确性。用词在词表中的情感类别、文本的句法特征、文本包含的表情符号这几个情感元素构建情感元素向量,与词向量合成,构建混合词向量,输入深度学习网络的Embedding层。同时,采用双向长短时记忆网络搭配Attention机制构建深度学习网络。使用流行的短文本数据集——中文微博——评估了混合词向量方法的有效性与效率。将情感分析的粒度细分为厌恶、愤怒、悲伤、快乐四种,采用远监督的方式标注细粒度情感标签。实验证明,混合词向量方法能够有效改进短文本词向量表征能力不足以及情感特征不明显问题,显著改善细粒度短文本情感分析的准确性,在数据集上取得了69.63%的准确率,准确率提升了7.12%。
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
基于情感词表与规则的方法流程图
情感分析方法法进行文本情感分析是近年来的研究分类、文本生成、自动问答系统等问网络的基本原理,然后介绍循环神经ficial Neural Networks)最开始被用于生理信息的一种模型。随后研究人员发作用。构是对大脑神经元的模拟,它的基础结络模型是由多个神经元连接构成的,
工神经网络称为前向神经网络(Feedforward Neural Networks),有环的人工神经网络称为循环神经网络(Recurrent Neural Networks)。2.2.2 循环神经网络循环神经网络的神经元带有反馈机制,可以处理序列数据。与前向神经网络不同循环神经网络的输入为当前时刻的输入和之前时刻的输出。这就意味着循环神经网络能够处理文本上下文之间的信息,很适合文本情感分析任务的需求。循环神经网络随时间展开的结构如图 2-3 所示,t 时刻的输入为 xt,t 时刻的隐藏状态为 ht,隐藏状态更新的计算公式为式 2-7。 = ( + + ) (2-7)其中,U 是输入到隐藏层的权值矩阵,W 是隐藏层到隐藏层的权值矩阵,b 是偏置项,f 是非线性激活函数。
【参考文献】:
期刊论文
[1]基于微博的细粒度情感分析[J]. 敦欣卉,张云秋,杨铠西. 数据分析与知识发现. 2017(07)
[2]细粒度情感分析的酒店评论研究[J]. 李鸣,吴波,宋阳,朱梦尧,徐志广,张宏俊. 传感器与微系统. 2016(12)
[3]基于句法分析的跨语言情感分析[J]. 陈强,何炎祥,刘续乐,孙松涛,彭敏,李飞. 北京大学学报(自然科学版). 2014(01)
[4]中文情绪识别方法研究[J]. 刘欢欢,李寿山,周国栋,李逸薇. 江西师范大学学报(自然科学版). 2013(02)
[5]中文文本情感分析研究综述[J]. 陆文星,王燕飞. 计算机应用研究. 2012(06)
[6]面向汽车领域的软文识别研究[J]. 唐都钰,王大亮,赵凯,秦兵,刘挺. 山东大学学报(理学版). 2012(03)
[7]基于汉语情感词表的句子情感倾向分类研究[J]. 王素格,杨安娜,李德玉. 计算机工程与应用. 2009(24)
硕士论文
[1]基于深度学习的微博评论情感倾向性分析[D]. 胡西祥.哈尔滨工业大学 2017
[2]基于循环神经网络的网络舆情文本情感分析技术研究[D]. 李松如.华侨大学 2017
[3]基于深度特征提取的文本情感极性分类研究[D]. 田竹.山东大学 2017
[4]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[5]基于深度学习的文本情感分析[D]. 王雪娇.吉林大学 2016
[6]中文微博细粒度情感判别研究[D]. 陈闯闯.南华大学 2016
[7]面向多类标分类的随机森林算法研究[D]. 赵亚红.哈尔滨工业大学 2014
[8]微博客细粒度情感分析技术的研究与实现[D]. 付连鹏.东北大学 2014
[9]中文微博细粒度情绪识别研究[D]. 雷龙艳.南华大学 2014
[10]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大学 2013
本文编号:3145197
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
基于情感词表与规则的方法流程图
情感分析方法法进行文本情感分析是近年来的研究分类、文本生成、自动问答系统等问网络的基本原理,然后介绍循环神经ficial Neural Networks)最开始被用于生理信息的一种模型。随后研究人员发作用。构是对大脑神经元的模拟,它的基础结络模型是由多个神经元连接构成的,
工神经网络称为前向神经网络(Feedforward Neural Networks),有环的人工神经网络称为循环神经网络(Recurrent Neural Networks)。2.2.2 循环神经网络循环神经网络的神经元带有反馈机制,可以处理序列数据。与前向神经网络不同循环神经网络的输入为当前时刻的输入和之前时刻的输出。这就意味着循环神经网络能够处理文本上下文之间的信息,很适合文本情感分析任务的需求。循环神经网络随时间展开的结构如图 2-3 所示,t 时刻的输入为 xt,t 时刻的隐藏状态为 ht,隐藏状态更新的计算公式为式 2-7。 = ( + + ) (2-7)其中,U 是输入到隐藏层的权值矩阵,W 是隐藏层到隐藏层的权值矩阵,b 是偏置项,f 是非线性激活函数。
【参考文献】:
期刊论文
[1]基于微博的细粒度情感分析[J]. 敦欣卉,张云秋,杨铠西. 数据分析与知识发现. 2017(07)
[2]细粒度情感分析的酒店评论研究[J]. 李鸣,吴波,宋阳,朱梦尧,徐志广,张宏俊. 传感器与微系统. 2016(12)
[3]基于句法分析的跨语言情感分析[J]. 陈强,何炎祥,刘续乐,孙松涛,彭敏,李飞. 北京大学学报(自然科学版). 2014(01)
[4]中文情绪识别方法研究[J]. 刘欢欢,李寿山,周国栋,李逸薇. 江西师范大学学报(自然科学版). 2013(02)
[5]中文文本情感分析研究综述[J]. 陆文星,王燕飞. 计算机应用研究. 2012(06)
[6]面向汽车领域的软文识别研究[J]. 唐都钰,王大亮,赵凯,秦兵,刘挺. 山东大学学报(理学版). 2012(03)
[7]基于汉语情感词表的句子情感倾向分类研究[J]. 王素格,杨安娜,李德玉. 计算机工程与应用. 2009(24)
硕士论文
[1]基于深度学习的微博评论情感倾向性分析[D]. 胡西祥.哈尔滨工业大学 2017
[2]基于循环神经网络的网络舆情文本情感分析技术研究[D]. 李松如.华侨大学 2017
[3]基于深度特征提取的文本情感极性分类研究[D]. 田竹.山东大学 2017
[4]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[5]基于深度学习的文本情感分析[D]. 王雪娇.吉林大学 2016
[6]中文微博细粒度情感判别研究[D]. 陈闯闯.南华大学 2016
[7]面向多类标分类的随机森林算法研究[D]. 赵亚红.哈尔滨工业大学 2014
[8]微博客细粒度情感分析技术的研究与实现[D]. 付连鹏.东北大学 2014
[9]中文微博细粒度情绪识别研究[D]. 雷龙艳.南华大学 2014
[10]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大学 2013
本文编号:3145197
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3145197.html
最近更新
教材专著