基于Attention-Based Bi-GRU模型的文本分类方法研究
发布时间:2021-02-06 08:29
大数据时代,各种终端设备产生了大量的文本数据,文本分类技术作为智能搜索、智能问答等自然语言处理的基础和关键技术一直是交叉学科领域的研究热点。由于文本是非结构化数据,利用传统机器学习方法解决文本分类时忽略了文本的上下文的语义信息且分类精度不高。随着深度学习技术的不断发展,深度学习技术被证明在提取文本特征和提升分类精度上有诸多优势。本文在分析研究GRU和Attention机制的基础上,对混合深度学习模型解决文本分类问题进行了深入研究。本文的主要研究工作如下:(1)本文给出了文本分类的数学定义并学习研究了文本分类的一般过程,包括文本预处理,文本表示,分类器设计及其性能评价。针对词向量表示,研究和采用了Word2Vec词向量表示,使得词向量表示具有同义词相似的特征,同时避免了维度过高导致的神经网络难以训练。梳理了若干传统文本分类方法并指出其具有的缺陷。(2)本文通过对GRU和Attention机制的研究,提出了一种文本分类混合模型——Attention-Based Bi-GRU,其中GRU解决了传统RNN在对序列数据进行编码时常常会面临长距离依赖消失的问题,Bi-GRU全面考虑了文本的上下文信...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
文本分类应用场景
文本分类的流程图
CBOW模型的结构图示
【参考文献】:
期刊论文
[1]循环神经网络研究综述[J]. 杨丽,吴雨茜,王俊丽,刘义理. 计算机应用. 2018(S2)
[2]基于互信息的加权朴素贝叶斯文本分类算法[J]. 武建军,李昌兵. 计算机系统应用. 2017(07)
[3]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英. 中文信息学报. 2015(05)
[4]基于语义距离的文本分类方法[J]. 张培颖,王雷全. 计算机技术与发展. 2013(01)
[5]基于自适应中文分词和近似SVM的文本分类算法[J]. 冯永,李华,钟将,叶春晓. 计算机科学. 2010(01)
[6]SVM和K-means结合的文本分类方法研究[J]. 晋幼丽,周明全,王学松. 计算机技术与发展. 2009(11)
[7]使用最大熵模型进行中文文本分类[J]. 李荣陆,王建会,陈晓云,陶晓鹏,胡运发. 计算机研究与发展. 2005(01)
[8]电子计算机与文献分类[J]. 侯汉清,黄刚. 计算机与图书馆. 1982(01)
硕士论文
[1]基于注意力机制和改进型RNN的Web文本情感分析研究[D]. 王治权.兰州大学 2018
[2]基于Attention Bi-LSTM的文本分类方法研究[D]. 王恰.华南理工大学 2018
[3]基于Attention-Based C-GRU模型的文本分类研究[D]. 杨东.北京交通大学 2018
[4]基于Attention-Based LSTM模型的文本分类技术的研究[D]. 张冲.南京大学 2016
[5]基于深度学习混合模型的文本分类研究[D]. 周超.兰州大学 2016
[6]中文文本分类的研究与应用[D]. 梅君.南昌大学 2010
本文编号:3020466
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
文本分类应用场景
文本分类的流程图
CBOW模型的结构图示
【参考文献】:
期刊论文
[1]循环神经网络研究综述[J]. 杨丽,吴雨茜,王俊丽,刘义理. 计算机应用. 2018(S2)
[2]基于互信息的加权朴素贝叶斯文本分类算法[J]. 武建军,李昌兵. 计算机系统应用. 2017(07)
[3]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英. 中文信息学报. 2015(05)
[4]基于语义距离的文本分类方法[J]. 张培颖,王雷全. 计算机技术与发展. 2013(01)
[5]基于自适应中文分词和近似SVM的文本分类算法[J]. 冯永,李华,钟将,叶春晓. 计算机科学. 2010(01)
[6]SVM和K-means结合的文本分类方法研究[J]. 晋幼丽,周明全,王学松. 计算机技术与发展. 2009(11)
[7]使用最大熵模型进行中文文本分类[J]. 李荣陆,王建会,陈晓云,陶晓鹏,胡运发. 计算机研究与发展. 2005(01)
[8]电子计算机与文献分类[J]. 侯汉清,黄刚. 计算机与图书馆. 1982(01)
硕士论文
[1]基于注意力机制和改进型RNN的Web文本情感分析研究[D]. 王治权.兰州大学 2018
[2]基于Attention Bi-LSTM的文本分类方法研究[D]. 王恰.华南理工大学 2018
[3]基于Attention-Based C-GRU模型的文本分类研究[D]. 杨东.北京交通大学 2018
[4]基于Attention-Based LSTM模型的文本分类技术的研究[D]. 张冲.南京大学 2016
[5]基于深度学习混合模型的文本分类研究[D]. 周超.兰州大学 2016
[6]中文文本分类的研究与应用[D]. 梅君.南昌大学 2010
本文编号:3020466
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3020466.html
最近更新
教材专著