当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的网络文本情绪分类研究

发布时间:2020-12-13 01:07
  随着网络的普及与发展,越来越多的使用者通过网络发表信息和交换个人意见,造成了网络中信息数据的爆炸式增长。由于网络的开放性和包容性,大量的信息充斥在网络环境中,实时监测网络环境,分析网络信息的情绪倾向,对维护网络的内容安全具有重大的意义。但通过人工的方式对如此庞大的数量级的信息进行处理分析是完全不可能实现的,而一般的数据处理及分类技术如关键词过滤等,虽然可以解决样本处理的效率问题,但由于语言表达方式的复杂性,并不能保证样本分类的精度。本文结合了安全和智能这两个当前计算机领域的重要研究方向,针对处理网络大量数据的内容安全问题,利用自然语言处理的相关技术,采用深度学习模型,通过利用神经网络模型对文本样本进行训练学习,根据样本的情绪倾向进行分类,实现对大量网络文本信息的高效处理。由于长短期记忆网络(LSTM,Long Short-Term Memory)在处理时间序列和延迟相对较长的任务方面所具有的优势,使得它在许多深度学习的相关领域得到了充分的应用。针对当前网络环境中越来越多样化的意见表达方式以及爆炸式的信息增长速率,本文提出了一种基于多维度LSTM的网络内容安全文本分类模型。该模型可以充分... 

【文章来源】:中国石油大学(华东)山东省 211工程院校 教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于深度学习的网络文本情绪分类研究


Sigmoid和Tanh函数图像

函数图像,函数图像,函数


第三章基于多维度LSTM模型的文本分类研究26xxxxeeeexf(3-15)xsigmoidxtanh122(3-16)图3-6为Sigmoid激活函数和Tanh激活函数的函数图像,从图像中可以直观的表现出两种激活函数的区别与联系。由Tanh函数的定义公式可以看出Tanh函数是Sigmoid函数的一种变型,因此Tanh函数的求导结果也可以用自身表示的变形。Tanh函数与Sigmoid函数的不同点在于,它将输入值的映射输出值范围压缩到[-1,1]的范围内,因此它的输出结果基本上来说是0均值的。虽然Tanh函数解决了Sigmoid函数所尊在的的0均值问题,但它仍然存在梯度饱和的问题。(3)ReLU激活函数。在模型训练过程中,在其优化过程中会出现非凸现象,影响深度神经网络的训练,为了优化这个问题,引入了ReLU函数。ReLU函数全称为RectifiedLinearUnit,也就是线性矫正单元,常用于隐含层的输出。其数学表达式为:x,maxxf0(3-17)ReLU函数的函数图像如图3-7所示。图3-7ReLU函数图像Fig3-7FunctionimageofReLU当ReLU函数的输入值小于0时,对应的输出值为0;当函数输入值大于0时,对于的输出值与输入值相等。Krizhevsky等人[56]研究发现在使用ReLU函数时,在计算梯度下降时模型的的收敛速度比使用Sigmoid函数或Tanh函数的模型要快很多。使用

表情,图片,模型,数据集


第四章多维度LSTM文本情绪分类模型设计与实现324.2多维度LSTM模型主要模块设计与实现本课题中的深度学习文本分类模型主要是针对社交网络中逐渐膨胀的文本信息,根据其情绪倾向进行分类。结合对现有深度学习分类模型的分析和研究,改进和提出了一种新的模型,以提高文本情绪分类的准确率。主要思想是采用LSTM作为模型的基本单元,采用多层LSTM作为一个特征提取通道,多个特征通道组成深度学习的训练模型,来处理文本分类的问题。以多通道的特征提取方式来处理文本情绪倾向的分类问题,提高分类的精确程度。接下来将对本文所设计多维度LSTM模型的主要模块的实现进行详细的阐述。4.2.1数据集建立基于深度学习的文本情绪分类模型的中心思想是利用数据集进行模型的训练,模型参数在迭代收敛后取得最优值,从而获得具有高精度分类效果的文本分类模型。由于目前并不存在适合本模型的通用数据集,因此针对本文所设计多维度LSTM模型,需要建立符合模型训练要求的数据集。图4-2emoji表情图片Fig4-2Emojiexpressionimage由于本模型是采用有监督的训练方法的二分类模型,所以本文分采用的数据集改造后的IMDB[57]数据集。IMDB是斯坦福大学人工智能实验室所收集建立的一个影评数据


本文编号:2913600

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2913600.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户94464***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com