基于深度学习的中文新闻文本分类研究
发布时间:2022-01-26 10:26
随着大数据技术的发展,文本分析所面临的数据量正在迅速的增长,对这些数据进行处理,并且从中获取重要的信息以便于管理者进行分析和决策对于社会发展有着重要意义,因此,自然语言处理这一研究领域正受到越来越多的关注。目前,文本分类正在由以统计和机器学习为基础的传统方法向基于复杂神经网络结构的深度学习方法逐渐过渡。然而,传统的深度学习框架在文本处理方面的应用还有着种种问题和提高的空间,本文研究了多种深度学习模型地原理以及在自然语言处理方面的应用,并且提出了使用改进的循环神经网络结合改进的卷积神经网络进行文本分类的方法。具体研究内容及结果如下:1、对国内外自然语言处理的技术进行了文献研究和介绍,对文本分类的基本流程和概念进行了详细介绍,包括分词方法、词向量生成算法、常用深度学习模型原理等。2、对于词向量生成方法,研究并修改了英文环境中最新的词向量化方法ELMo模型,并且将其应用到中文文本分类任务中,与传统的word2vec方法进行了实证效果的比较。3、对于中文文本分类模型,本文基于卷积神经网络和循环神经网络提出了一个新的深度学习模型,通过将GRU和GCNN模型结合,用循环网络和卷积网络对文本信息进行...
【文章来源】:西南财经大学四川省 211工程院校 教育部直属院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
one-hot词向量表示
神经网络语言模型结构
CBOW模型示意图
【参考文献】:
期刊论文
[1]基于深度信念网络的文本分类算法[J]. 陈翠平. 计算机系统应用. 2015(02)
[2]稀疏自动编码器在文本分类中的应用研究[J]. 秦胜君,卢志平. 科学技术与工程. 2013(31)
[3]基于SVM算法的文本分类技术研究[J]. 崔建明,刘建明,廖周宇. 计算机仿真. 2013(02)
[4]一种基于改进TF-IDF函数的文本分类方法[J]. 卢中宁,张保威. 河南师范大学学报(自然科学版). 2012(06)
[5]基于粗糙集的快速KNN文本分类算法[J]. 孙荣宗,苗夺谦,卫志华,李文. 计算机工程. 2010(24)
[6]支持向量机的参数优化及其文本分类中的应用[J]. 丁勇,秦晓明,何寒晖. 计算机仿真. 2010(11)
[7]SVM和K-means结合的文本分类方法研究[J]. 晋幼丽,周明全,王学松. 计算机技术与发展. 2009(11)
[8]基于模式聚合和决策树的文本分类规则抽取[J]. 王煜,王正欧. 情报科学. 2006(01)
[9]基于改进KNN的文本分类方法[J]. 钱晓东,王正欧. 情报科学. 2005(04)
本文编号:3610328
【文章来源】:西南财经大学四川省 211工程院校 教育部直属院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
one-hot词向量表示
神经网络语言模型结构
CBOW模型示意图
【参考文献】:
期刊论文
[1]基于深度信念网络的文本分类算法[J]. 陈翠平. 计算机系统应用. 2015(02)
[2]稀疏自动编码器在文本分类中的应用研究[J]. 秦胜君,卢志平. 科学技术与工程. 2013(31)
[3]基于SVM算法的文本分类技术研究[J]. 崔建明,刘建明,廖周宇. 计算机仿真. 2013(02)
[4]一种基于改进TF-IDF函数的文本分类方法[J]. 卢中宁,张保威. 河南师范大学学报(自然科学版). 2012(06)
[5]基于粗糙集的快速KNN文本分类算法[J]. 孙荣宗,苗夺谦,卫志华,李文. 计算机工程. 2010(24)
[6]支持向量机的参数优化及其文本分类中的应用[J]. 丁勇,秦晓明,何寒晖. 计算机仿真. 2010(11)
[7]SVM和K-means结合的文本分类方法研究[J]. 晋幼丽,周明全,王学松. 计算机技术与发展. 2009(11)
[8]基于模式聚合和决策树的文本分类规则抽取[J]. 王煜,王正欧. 情报科学. 2006(01)
[9]基于改进KNN的文本分类方法[J]. 钱晓东,王正欧. 情报科学. 2005(04)
本文编号:3610328
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3610328.html
最近更新
教材专著