当前位置:主页 > 经济论文 > 电子商务论文 >

基于深度学习的商品评价情感分析与研究

发布时间:2020-05-07 02:56
【摘要】:移动互联网助推的电子商务时代使得商品评价空前繁荣,论文提出一种基于深度学习的改进型模型来分析评价数据的情感。首先通过分词与综合停用词表等预处理数据集,然后使用Skip-gram模型训练出数据集中每个词的词向量,并使用自扩充情感词典对评价语句情感极性进行量化,量化的情感正负值与词向量形成融合矩阵输入,并通过分流规则设计进行差异网络输入,选择CNN或RNN完成抽象特征提取,即Shunt-CRNN产品评价分类模型(改进型深度学习方法)。与传统机器学习SVM相比,改进型深度学习方法准确率大幅提升6.6%,较单一深度学习方法提高了近1.5%。
【图文】:

矩阵图,情感,矩阵,极值


第46卷处理,同时通过word2vec将每个词词向量求出,如图4所示,每个句子最多可分解为n个词,同时每个词转为k维的词向量,即一句评论文本将成为n×k的二维矩阵。本文将词向量k设为200维,同时为控制矩阵的稀疏度,将文本评价语料控制在最多见的64字以内,即64×200的矩阵表示一句评论文本,少于64字的评价语料进行补零处理。图4相似词的词向量矢量距离处理示意图除图5本身语料转化的词向量矩阵“{X1,X2,X3,…,Xi}”外,本文对每句评价语料进行了扩充词典的正负情感词匹配,从而量化评价语料的情感正负极性,并将量化后的情感极性值正向(positive)方面+1,负向(negative)方面-1,为防止因训练不足导致的分类精度降低,将情感极值向量进行拉普拉斯平滑,如下式所示。Pλ(X(j)=ajk|Y=Cn)=i=1MIx(j)i=ajk啜yi=Cn)+λi=1MIyi=Cn)+SjλPλ(Y=Cn)=i=1MIyi=cn)+λM+Nλ其中ajk代表第j个特征的第k个选择,Sj代表第j个特征的个数,而N代表种类的个数。图5模型输入向量的处理示意图最终形成一个如图5所示的全新输入向量:K=(P啜W啜N)其中P为正向情感量化向量,Pa为第a个词的12维{Pa1,Pa2,…,Pa12}正向(positive)情感量化向量,且增加至Xa1之前,其中aij为一句评价语料的第i个词的情感量化值;W为通过Skip-gram得到的词向量,N为负向情感量化向量,Na为第a个词的

卷积核,对窗,模型结构,结构图


对于文本的分流处理采用了字段长度和情感极性两个重要判断依据,字段长度主要体现一段评论的前后文关联性,同时在每句评价语料中情感的丰富程度,,情感极性量化可对其进行判断。通过多次实验测试,本文在分流器规则设计方面,选择将30字以上且情感丰富度高的语料输入RNN网络,其余则输入CNN网络进行处理。3.3.2构建CNN网络模型本文采用的多层卷积神经网络模型(CNN),整个模型由3层卷积层、1层池化层、1层Flatten层、1层全连接层及Softmax层构成,结构如图6所示。图6CNN模型结构结构图卷积核ω∈Rh×k是对窗口大小为h的k维词向量进行卷积操作,输出特征为Xi=f(ω′Ci:i+h-1+b)其中Xi为特征,Ci:i+h-1为输入的文本向量,为激活函数,较常见的如sigmod函数、tanh函数、ReLu函数等,本文考虑了整流线性函数对基于梯度方法的优化属性与训练收敛速度,故采用了ReLu函数作为激活函数:f(x)=max(0啜x)本文每层卷积层由128个3×3的卷积核来学习并提取文本情感特征。卷积核ω对输入向量K=(P,W,N)进行卷积,即可得到一张特征图:X=[x1啜x2啜

本文编号:2652315

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2652315.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bfd12***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com