基于深度学习技术的文本情感分类算法研究
发布时间:2021-01-17 15:48
随着互联网技术以及网络平台的日益火热,越来越多的人参与到网络信息交互中。如今,大量的文本信息呈井喷式出现,人们通过网络与社交平台来表达自己的见解。通过挖掘这些文本内容,不仅可以了解用户的喜好,了解社会的热点问题,还能得到商品服务的评价信息等因素。因此,文本情感分析无论是从经济或是政治角度都有其重要性。通过对这些文本进行分析、处理、归纳和推理,我们能够在网络舆情发现等应用方面挖掘到重大的商业价值。因此,本文研究了基于深度学习技术的文本情感分类算法,具体内容包括以下几个方面:首先,实现了卷积双向长短期记忆(CNN-BiLSTM)网络模型。该模型结合了卷积神经网络(Convolutional Neural Networks,CNN)能提取高维文本特征和双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)擅长处理序列式问题的优点。本文对该模型在文本情感分类问题上进行了研究。包括设计多种规模的卷积核来提取不同的纬度特征,使用可以保留多个较强特征的KMax池化层代替仅能保留最强特征的1Max池化层。实验结果表明,CNN-BiLSTM-KMa...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
情感分析方法
第1章绪论4其分为篇章级、句子级、短语级和词语级。对文本的处理方法可以分为两大类。其中一类是按照词典规则的方法去分析,另一类是基于机器学习的方法去整理,具体如图所示。在文本处理的流程中,我们能够将情感归纳为:情感信息的获娶文本的预处理、情感信息的特征提取以及情感信息的分类或预测,这几项任务级级推进[1]。如图1.2所示。图1.2情感分析处理流程1.2.1基于词典规则的方法在基于词典规则的研究方法中,将要求我们将需要处理的文本看作集合而不考虑词语之间的连续问题,并且与通过我们自己制定的语言规则和人工标注的人工情感词典进行匹配。对文本段落、单词、句子进行拆解,将词语与情感词典进行匹配,得到一个得分,最终按照得分对文本进行情感倾向性分析。而其中的词性、词频,还有词语强度都会影响分析效果。在技术分析里面,构建情感词典的方式有很多种,如基于图的方法,基于启发式的规则方法,基于词对齐模型的方法等[2]。我们从中选择启发式的规则方法来进行探究。该方法通过观察大量语料总结出其特性,如找到其存在的一些语法句法、语法规则,语义特征甚至是语言学特性,然后再根据既定的语法规则、模式对他的特性进行拆解,获得其语言学特性。最后判断被抽取出的情感词对其特性是积极的还是消极的。基于启发式规则的方法虽然有着很强的针对性并且易于理解和应用,但缺点在于一方面要花费大量的时间,另一方面人工定义的规则灵活性差。当在处理一些网络非正式文本的过程中,利用语法信息通常会产生大量的错误。因此在情感词抽取的研究中,基于图传播的研究方法
第2章相关研究基础10第2章相关研究基础2.1人工神经网络人脑的构造和思维的运行机理一直是科学家们致力于探索的课题,亿万个神经元以特殊的形式组合在一起,在处理非确定性问题上有着计算机难以比拟的优越性。它的提出,是建立在现代神经科学研究的成果之上,试图通过模拟大脑的处理和记忆方式进行研究。应运而生的人工神经网络在模仿人类大脑的同时也显现出一些明显的特征:人工神经网络也想像人脑一样有自己的智慧,会思考解决问题的不同种方式,即非线性;人工神经网络也像人体各个器官一样协同工作,互相作用,而不是单单只依靠一个器官,人工神经网络中的神经元也是如此,即非局限性;人工神经会自己不断进行组织和学习,适应外界变化,即非常定性;一个系统能经久不衰的秘诀在于不断进化,不断演变,而不是原地踏步,能够在一定的条件下不断演变的特性,即非凸性。研究学者们借鉴了生物科学的研究成果,仿生大脑结构,提出了人工神经网络,为信息科学领域带来了革命性的变化。图2.1简单的人工神经网络
【参考文献】:
期刊论文
[1]基于词向量和CNN的书籍评论情感分析方法[J]. 李昊璇,张华洁. 测试技术学报. 2019(02)
[2]注意力增强的双向LSTM情感分析[J]. 关鹏飞,李宝安,吕学强,周建设. 中文信息学报. 2019(02)
[3]基于卷积神经网络的细粒度情感分析方法[J]. 李慧,柴亚青. 数据分析与知识发现. 2019(01)
[4]卷积神经网络下的Twitter文本情感分析[J]. 王煜涵,张春云,赵宝林,袭肖明,耿蕾蕾,崔超然. 数据采集与处理. 2018(05)
[5]基于词注意力卷积神经网络模型的情感分析研究[J]. 王盛玉,曾碧卿,商齐,韩旭丽. 中文信息学报. 2018(09)
[6]文本情感分析综述[J]. 刘爽,赵景秀,杨红亚,徐冠华. 软件导刊. 2018(06)
[7]面向自然语言处理的深度学习研究[J]. 奚雪峰,周国栋. 自动化学报. 2016(10)
[8]情感词典构建综述[J]. 梅莉莉,黄河燕,周新宇,毛先领. 中文信息学报. 2016(05)
[9]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英. 中文信息学报. 2015(05)
[10]航空发动机试车台推力校准系统[J]. 雷利,叶耀祖,马昌. 工程与试验. 2015(03)
硕士论文
[1]基于深度学习的微博文本情感分析研究[D]. 宋梦姣.南京大学 2018
本文编号:2983161
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
情感分析方法
第1章绪论4其分为篇章级、句子级、短语级和词语级。对文本的处理方法可以分为两大类。其中一类是按照词典规则的方法去分析,另一类是基于机器学习的方法去整理,具体如图所示。在文本处理的流程中,我们能够将情感归纳为:情感信息的获娶文本的预处理、情感信息的特征提取以及情感信息的分类或预测,这几项任务级级推进[1]。如图1.2所示。图1.2情感分析处理流程1.2.1基于词典规则的方法在基于词典规则的研究方法中,将要求我们将需要处理的文本看作集合而不考虑词语之间的连续问题,并且与通过我们自己制定的语言规则和人工标注的人工情感词典进行匹配。对文本段落、单词、句子进行拆解,将词语与情感词典进行匹配,得到一个得分,最终按照得分对文本进行情感倾向性分析。而其中的词性、词频,还有词语强度都会影响分析效果。在技术分析里面,构建情感词典的方式有很多种,如基于图的方法,基于启发式的规则方法,基于词对齐模型的方法等[2]。我们从中选择启发式的规则方法来进行探究。该方法通过观察大量语料总结出其特性,如找到其存在的一些语法句法、语法规则,语义特征甚至是语言学特性,然后再根据既定的语法规则、模式对他的特性进行拆解,获得其语言学特性。最后判断被抽取出的情感词对其特性是积极的还是消极的。基于启发式规则的方法虽然有着很强的针对性并且易于理解和应用,但缺点在于一方面要花费大量的时间,另一方面人工定义的规则灵活性差。当在处理一些网络非正式文本的过程中,利用语法信息通常会产生大量的错误。因此在情感词抽取的研究中,基于图传播的研究方法
第2章相关研究基础10第2章相关研究基础2.1人工神经网络人脑的构造和思维的运行机理一直是科学家们致力于探索的课题,亿万个神经元以特殊的形式组合在一起,在处理非确定性问题上有着计算机难以比拟的优越性。它的提出,是建立在现代神经科学研究的成果之上,试图通过模拟大脑的处理和记忆方式进行研究。应运而生的人工神经网络在模仿人类大脑的同时也显现出一些明显的特征:人工神经网络也想像人脑一样有自己的智慧,会思考解决问题的不同种方式,即非线性;人工神经网络也像人体各个器官一样协同工作,互相作用,而不是单单只依靠一个器官,人工神经网络中的神经元也是如此,即非局限性;人工神经会自己不断进行组织和学习,适应外界变化,即非常定性;一个系统能经久不衰的秘诀在于不断进化,不断演变,而不是原地踏步,能够在一定的条件下不断演变的特性,即非凸性。研究学者们借鉴了生物科学的研究成果,仿生大脑结构,提出了人工神经网络,为信息科学领域带来了革命性的变化。图2.1简单的人工神经网络
【参考文献】:
期刊论文
[1]基于词向量和CNN的书籍评论情感分析方法[J]. 李昊璇,张华洁. 测试技术学报. 2019(02)
[2]注意力增强的双向LSTM情感分析[J]. 关鹏飞,李宝安,吕学强,周建设. 中文信息学报. 2019(02)
[3]基于卷积神经网络的细粒度情感分析方法[J]. 李慧,柴亚青. 数据分析与知识发现. 2019(01)
[4]卷积神经网络下的Twitter文本情感分析[J]. 王煜涵,张春云,赵宝林,袭肖明,耿蕾蕾,崔超然. 数据采集与处理. 2018(05)
[5]基于词注意力卷积神经网络模型的情感分析研究[J]. 王盛玉,曾碧卿,商齐,韩旭丽. 中文信息学报. 2018(09)
[6]文本情感分析综述[J]. 刘爽,赵景秀,杨红亚,徐冠华. 软件导刊. 2018(06)
[7]面向自然语言处理的深度学习研究[J]. 奚雪峰,周国栋. 自动化学报. 2016(10)
[8]情感词典构建综述[J]. 梅莉莉,黄河燕,周新宇,毛先领. 中文信息学报. 2016(05)
[9]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英. 中文信息学报. 2015(05)
[10]航空发动机试车台推力校准系统[J]. 雷利,叶耀祖,马昌. 工程与试验. 2015(03)
硕士论文
[1]基于深度学习的微博文本情感分析研究[D]. 宋梦姣.南京大学 2018
本文编号:2983161
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2983161.html
最近更新
教材专著