基于深度学习的文本分类方法研究及应用
发布时间:2024-05-19 02:33
互联网技术改变了人们信息交流的方式,分享消费感受、评价服务质量、发表个人看法等已成为众多用户的日常习惯。这些评论的文本信息中往往包含了用户对当前评价对象的情感倾向,有效挖掘与利用评价信息是大数据时代提升企业竞争力不可或缺的手段,其核心技术是文本分类。文本分类被广泛应用到自然语言处理的绝大部分场景中,从基于知识的方法逐渐转变为基于统计和机器学习的方法。传统的基于机器学习的文本分类方法普遍存在特征工程复杂和文本向量化表示高维稀疏等问题,使得分类效果不佳。近年来,基于深度学习的文本分类方法在一定程度上克服了传统机器学习方法的不足,提高了文本分类的准确率。因此,本文在对比分析了文本分类的主流方法基础上,提出了融合注意力机制和CNN卷积神经网络的CN&AT-BLSTM模型,利用长短期记忆网络(LSTM)的序列化处理优势,借助序列的长距离依赖信息,提升中文文本分类的准确度。在此基础上,面向酒店服务评价应用场景搭建了实验系统。本文具体研究内容包括:(1)文本分类的过程中一般采取统一语素赋值的方法,导致了重要语素丢失或非重要语素冗余的问题,针对这一问题,基于Attention机制和BLSTM模...
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
本文编号:3977491
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图2-1CBOW的模型结构
北方民族大学2020届硕士学位论文第二章相关理论技术-10-成词向量。(1)CBOW模型思想是以当前词的上下文表示Cij为基础,预测当前词的表示Wij。指定文本为D,CBOW的目的是使文档获得最大的后验概率。计算方式为:DjTijijijCwp]);|([maxargj1(2-1....
图2-2Skip-gram的模型结构
北方民族大学2020届硕士学位论文第二章相关理论技术-11-下降法更新参数。(2)Skip-gram模型思想是通过当前词wij预测上下文Cij,最大化文本信息的后验概率的计算方式为:DCcijcpijWij]);w|([maxarg(2-3)Skip-gram模型舍弃了映射层,把....
图2-3循环神经网络结构图
北方民族大学2020届硕士学位论文第二章相关理论技术-14-仅可以最大程度的利用语义信息,而且还能高效的挖掘数据所蕴含的时序信息。传统的神经网络结构包含输入层、隐藏层和输出层,各层之间以全连接的方式连接,但是层内之间的各个神经元没有连接,所以传统的神经网络不能有效解决一些特殊问题....
图2-4循环神经网络按时间的展开图
北方民族大学2020届硕士学位论文第二章相关理论技术-14-仅可以最大程度的利用语义信息,而且还能高效的挖掘数据所蕴含的时序信息。传统的神经网络结构包含输入层、隐藏层和输出层,各层之间以全连接的方式连接,但是层内之间的各个神经元没有连接,所以传统的神经网络不能有效解决一些特殊问题....
本文编号:3977491
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3977491.html