当前位置:主页 > 科技论文 > 软件论文 >

基于改进的Multi-Channel CNN-LSTM模型在Twitter文本情感分析中的应用

发布时间:2022-02-10 15:50
  近年来随着4G技术的大规模商用和移动互联网的迅猛发展,社交媒体平台每天产生海量用户社交信息。为了及时了解人们的看法和情绪倾向,需要对用户发表的观点进行文本情感分析。基于情感词典和机器学习为代表的传统情感分析方法存在一些不足,如严重依赖情感词典及人工维护文本特征。当前,以CNN-LSTM为代表的深度学习模型弥补了传统方法的缺陷,但在不同情感粒度单元的侧重点不同,而忽视了整体情感判断。本文提出了基于Multi-Channel CNN-LSTM的英文文本情感分析方法,具体创新点如下:1、目前使用广泛的单通道CNN-LSTM在特殊语境下表现不佳,这是因为词中所蕴涵的信息不足,某些字信息结合单词信息可以更好地分析。本文将其改为多输入通道,分为词通道和字通道,使得能够同时接受词级别(word-level)向量和字级别(char-level)向量进行分析,再将两个通道输出向量进行融合,进入全连接层和Softmax层进行分类。此举能解决依赖分词质量和不能有效处理序列数据的问题。经过改进后的模型与CNN-LSTM模型对比,能够在Sentiment140数据集上将Accuracy指标从0.81提升至0.8... 

【文章来源】:河南大学河南省

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于改进的Multi-Channel CNN-LSTM模型在Twitter文本情感分析中的应用


Onehot矩阵图示

卷积,输出矩阵,特征矩阵,卷积核


图 2-2 卷积图示的特征矩阵 ,卷积核大小为 k×k,填充(padding)输出矩阵大小为 N×N,那么有:21M p kNstep 入 5×5 的特征矩阵,使用 3×3 大小的卷积核进行adding),那么输出矩阵的维度 N=(5-3)/1+1=3,即 的矩阵。以图中黑色矩形框选的部分为例,将框住,再将每一位相乘的结果相加,就是输出矩阵对应) ×5+0×4+1×2+(-1) ×3+0×4+1×5=0,所以输出期记忆理论[41]最早由Hochreiter和Schmidhuber等人

计算过程


图 2-4 Attention 计算过程率分布的时候,由于对于输入句子 X 中任意制的模型理论上表现更好,但也存在一定问低等问题,特别是训练样本量非常大的时候语言处理与文本情感分析子领域里应用比较技术、卷积神经网络模型、LSTM 模型和 A背景、发展历程、数学原理推导与证明、所模型或技术的细节、特点、优势和劣势。并对包含字嵌入,是将单词(字符)文本映射到


本文编号:3619107

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3619107.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2184d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com