当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的文本情绪多标签分类方法研究

发布时间:2020-03-19 13:25
【摘要】:互联网的快速发展给电子商务平台和社交平台注入了新的活力,交互网站的数量迅速增加,人们越来越倾向于通过社交媒介来发表自己的意见和看法。因此,大量的包含人们情感和情绪的文本数据累积于互联网上,如何有效的利用自然语言处理技术来分析和挖掘这类数据并提取出有价值的信息,已经成为网络舆情监控、用户消费行为分析和电子商务交互等领域关注的热点课题。对于文本情感分析而言,传统的基于单标签的有监督学习方法已经难以满足多样性的文本处理需求,开展对文本的情感和情绪进行多标签分类具有重要的理论意义和应用价值。在自然语言处理领域,深度学习技术可将文本数据进行分布式表示,再通过构建复杂网络来学习数据的深层次抽象特征,以避免繁琐的特征构建工作。因此,本文基于深度学习方法,开展文本情绪的多标签分类方法研究。具体内容和结论如下:(1)文本情绪多标签分类问题分析。通过对文本情感数据的分析,对文本中存在的多种情感信息,确定了以细粒度的方式来进行文本的情感分类。(2)融合标签特征的情绪多标签分类。当文本对应多个情感标签时,每个标签都包含着文本的不同信息,标签中的信息量相对较大,合理的利用标签特征将更加有利于文本的表示,从而提高文本多标签分类的性能。本文提出一种融合标签特征的卷积神经网络模型的情绪文本多标签分类方法。该方法利用卷积神经网络对文本及其对应的情绪标签分别进行特征抽取,最后将情绪文本特征和标签特征融合作为对文本的整体表示对文本的多标签进行分类。我们在NLPCC2014的中文微博情绪分析数据集上进行实验,平均精确率达到了0.6227,从而表明了使用标签特征的CNN模型可以提升微博情绪分类的性能。(3)分层注意力的LSTM文本多标签分类。为了利用句子的结构和层次信息对文本进行深层次的表示,同时又利用标签之间的相关性信息,本文给出一种基于层次结构和注意力模型的循环神经网络的文本情绪多标签分类方法。该方法分为编码和解码两个过程,编码过程将情绪文本从词到句子,再到文本逐层进行表示,并加入词到句子的注意力以及句子到文本的注意力,自下向上对情绪文本进行表示。解码时使用循环神经网络对文本进行多标签表示。在文献[47]数据集上,平均精确率达到了0.6086。
【图文】:

模型图,模型图,上下文信息


术 的文本表示从大量的文本中挖掘文本的情绪信息,对一的形式以方便计算机去读取和处理这些法之一,它能够将高维的稀疏空间上的词,大大降低了词表示的复杂度。2013 年,出世,它利用词的上下文信息在百万级和度量出词与词之间的相似性,收到很多 N了深度学习技术在自然语言处理领域的快分别为:CBOW 模型和 Skip-gram 模型。型使用词的上下文信息来预测中心词,其词对应的词向量,而输出就是这特定的一

模型图,模型图


图 2.2 Skip-gram 模型图为一种词向量表示方法,它在训练时不仅利用的顺序信息和语义信息,因而它能够更加准上提高了 NLP 任务的性能,本文使用 word量。46]等人模拟人脑处理信号时的分层处理机制,出深度学习的概念。随着深度学习技术的不深度学习的主要模型之一,卷积神经网络在于是研究人员逐渐开始将其应用于其他领域文本分类任务中,并取得了不错的分类性能结构:输入层、卷积层、池化层、输出层。入文本句子中词语的词向量,这些词向量既可
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP18

【相似文献】

相关期刊论文 前10条

1 汪明霓;BASIC文本系统[J];计算机应用研究;1988年01期

2 易树鸿;张为群;;一种基于粗集的文本数据特征信息的挖掘方法[J];计算机科学;2002年08期

3 娄道国;李若斌;刘冰;张冬冬;;云计算下各分散文本数据的全方位集成融合方法[J];科技通报;2019年02期

4 潘大胜;;不确定噪声下海量文本数据的模糊挖掘算法研究[J];微电子学与计算机;2017年09期

5 王珊珊;冯利鑫;;基于新词识别的大数据聊天文本舆情热点挖掘[J];电子商务;2018年01期

6 陈晓峰;如何在flash中读入外部文本数据[J];电脑知识与技术;2004年13期

7 马欣欣;林克;;大文本数据快速分析统计理论与算法[J];电子元器件与信息技术;2019年01期

8 施瑞朗;;基于社交平台数据的文本分类算法研究[J];电子科技;2018年10期

9 张玉红;陈伟;胡学钢;;一种面向不完全标记的文本数据流自适应分类方法[J];计算机科学;2016年12期

10 袁鹏;江媛媛;;多元化文本数据的智能提取[J];测绘与空间地理信息;2015年09期

相关会议论文 前10条

1 易天元;叶春生;;工业锅炉图纸输入的文本数据处理[A];1997中国控制与决策学术年会论文集[C];1997年

2 陈光强;杨树强;张晓辉;李润恒;贾焰;;面向海量文本数据的多任务并行调度加载技术研究与实现[A];第15届全国信息存储技术学术会议论文集[C];2008年

3 周纯洁;黎],

本文编号:2590282


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2590282.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89c2d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com