基于卷积神经网络结合词向量的中文短文本分类研究

发布时间:2021-12-09 10:36
  文本分类是自然语言处理领域里用于文本信息处理的关键性技术,主要由文本表示和分类模型(算法)组成。在当今文本信息极速增长的时代,文本分类为人们有效、便捷、快速地获取所需信息发挥着重大作用。短文本作为文本信息的主要载体之一,具有长度短、特征稀疏、实时性强、格式不规则等特点,从而基于词袋特征或向量空间的传统机器学习算法不能有效的提取短文本特征,进而影响分类效果。深度学习算法强大的特征提取能力在文本分类中具有独特的优势,因此,利用深度学习进行文本分类建模成为当前的研究热点。本文基于卷积神经网络模型并结合词向量的文本表示方法,针对中文短文本分类的相关技术点进行研究工作,取得的相关研究成果如下:1、提出一种应用于卷积神经网络文本分类的词向量模型。文本特征提取(文本输入表示)作为文本分类技术的要点,其构建质量直接影响着分类系统的分类效果。现在最流行的文本输入表示——词向量(Word Vector)虽然考虑了词语之间的关联性和相似性,但忽略了上下文局部词序特征,在一些情况下造成文本语义上的缺失和歪曲。为此,本文提出了一种结合N-Gram特征与Word2vec的词向量模型WordNG-Vec,其提取出的... 

【文章来源】:重庆理工大学重庆市

【文章页数】:45 页

【学位级别】:硕士

【部分图文】:

基于卷积神经网络结合词向量的中文短文本分类研究


向量空间模型

基于卷积神经网络结合词向量的中文短文本分类研究


CBOW模型架构

基于卷积神经网络结合词向量的中文短文本分类研究


Skip-gram模型架构

【参考文献】:
期刊论文
[1]基于吸引子传播聚类的改进双通道CNN短文本分类算法[J]. 王儒,刘培玉,王培培.  小型微型计算机系统. 2017(08)
[2]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军.  计算机学报. 2017(06)
[3]深度学习研究进展[J]. 刘建伟,刘媛,罗雄麟.  计算机应用研究. 2014(07)
[4]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟.  计算机研究与发展. 2013(09)
[5]文本分类综述[J]. 靳小波.  自动化博览. 2006(S1)
[6]基于机器学习的文本分类技术研究进展[J]. 苏金树,张博锋,徐昕.  软件学报. 2006(09)

博士论文
[1]基于深度学习的文本表示与分类方法研究[D]. 闫琰.北京科技大学 2016

硕士论文
[1]文本分类系统设计与实现[D]. 张琛馨.中山大学 2015
[2]基于机器学习的中文文本分类方法研究[D]. 刘依璐.西安电子科技大学 2009



本文编号:3530493

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3530493.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5ad0d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com