基于卷积神经网络的短文本表示与分类研究
发布时间:2021-12-10 05:55
随着互联网的高速发展,文本数据的产生量也呈急剧增加的趋势,尤其是社交和购物等终端产生的短文本更是量多类杂,海量的短文本数据给自然语言处理研究方向提供了大量的数据,同时也给文本分类等研究带来了巨大挑战。本文致力于研究自然语言处理中的短文本分类任务,力图提高短文本分类的准确度。文本分类任务主要分为长文本分类和短文本分类。在处理短文本分类任务时,由于文本具有文本长度短、特征高稀疏、句子语义表达较差等特点,所以运用传统的基于统计语言学技术处理短文本遇到了很多困难,例如受短文本开放性强的影响,传统的词语编码不能有效的进行高质量编码;由于短文本语义性较差,所以在通过传统的文档表示模型处理短文本时往往效果欠佳等。针对短文本分类的诸多困难,本文主要从以下三个方面进行研究:(1)研究词向量编码方式,分别采用密度峰值聚类算法和吸引子传播聚类算法对词向量进行聚类。首先采用人工神经网络对词语通过词嵌入的方式进行编码,进而对文本词语编码方式进行改进;然后对训练好的词向量进行聚类处理,聚类处理旨在减少噪声干扰对分类模型的影响;最终通过聚类得到的词典库具有更佳的编码规范性。(2)研究卷积神经网络分类模型,提出一种新...
【文章来源】:山东师范大学山东省
【文章页数】:40 页
【学位级别】:硕士
【部分图文】:
NNLM模型结构示意图
决策图
【参考文献】:
期刊论文
[1]基于类别特征改进的KNN短文本分类算法[J]. 黄贤英,熊李媛,刘英涛,李沁东. 计算机工程与科学. 2018(01)
[2]基于词向量和情感本体的短文本情感分类[J]. 王正成,李丹丹. 浙江理工大学学报(社会科学版). 2018(01)
[3]基于深度学习的短文本评论产品特征提取及情感分类研究[J]. 李杰,李欢. 情报理论与实践. 2018(02)
[4]基于SVM的高维混合特征短文本情感分类[J]. 王义真,郑啸,后盾,胡昊. 计算机技术与发展. 2018(02)
[5]基于word embedding的短文本特征扩展与分类[J]. 孟欣,左万利. 小型微型计算机系统. 2017(08)
[6]短文本理解研究[J]. 王仲远,程健鹏,王海勋,文继荣. 计算机研究与发展. 2016(02)
[7]基于聚类改进的KNN文本分类算法[J]. 周庆平,谭长庚,王宏君,湛淼湘. 计算机应用研究. 2016(11)
[8]一种改进的短文本层次聚类算法[J]. 李天彩,席耀一,王波,张佳明. 信息工程大学学报. 2015(06)
[9]基于卷积神经网络的微博情感倾向性分析[J]. 刘龙飞,杨亮,张绍武,林鸿飞. 中文信息学报. 2015(06)
[10]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
博士论文
[1]基于深度学习的文本表示与分类方法研究[D]. 闫琰.北京科技大学 2016
[2]基于深度学习的短文本分析与计算方法研究[D]. 李岩.北京科技大学 2016
[3]文本分类关键技术及应用研究[D]. 凤丽洲.吉林大学 2015
硕士论文
[1]中文文本聚类关键技术研究[D]. 邵明来.广西大学 2015
[2]基于密度的层次聚类算法研究[D]. 张文开.中国科学技术大学 2015
[3]基于词向量的短文本分类方法研究[D]. 江大鹏.浙江大学 2015
[4]中文短文本分类技术的研究与实现[D]. 熊大康.安徽大学 2014
[5]基于复杂网络的中文文本分类研究[D]. 赵辉.西安电子科技大学 2014
[6]面向文本分类的特征提取算法研究[D]. 彭君睿.北京邮电大学 2014
[7]基于听觉图像的音乐流派自动分类系统研究[D]. 李秋颖.天津大学 2012
本文编号:3532031
【文章来源】:山东师范大学山东省
【文章页数】:40 页
【学位级别】:硕士
【部分图文】:
NNLM模型结构示意图
决策图
【参考文献】:
期刊论文
[1]基于类别特征改进的KNN短文本分类算法[J]. 黄贤英,熊李媛,刘英涛,李沁东. 计算机工程与科学. 2018(01)
[2]基于词向量和情感本体的短文本情感分类[J]. 王正成,李丹丹. 浙江理工大学学报(社会科学版). 2018(01)
[3]基于深度学习的短文本评论产品特征提取及情感分类研究[J]. 李杰,李欢. 情报理论与实践. 2018(02)
[4]基于SVM的高维混合特征短文本情感分类[J]. 王义真,郑啸,后盾,胡昊. 计算机技术与发展. 2018(02)
[5]基于word embedding的短文本特征扩展与分类[J]. 孟欣,左万利. 小型微型计算机系统. 2017(08)
[6]短文本理解研究[J]. 王仲远,程健鹏,王海勋,文继荣. 计算机研究与发展. 2016(02)
[7]基于聚类改进的KNN文本分类算法[J]. 周庆平,谭长庚,王宏君,湛淼湘. 计算机应用研究. 2016(11)
[8]一种改进的短文本层次聚类算法[J]. 李天彩,席耀一,王波,张佳明. 信息工程大学学报. 2015(06)
[9]基于卷积神经网络的微博情感倾向性分析[J]. 刘龙飞,杨亮,张绍武,林鸿飞. 中文信息学报. 2015(06)
[10]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
博士论文
[1]基于深度学习的文本表示与分类方法研究[D]. 闫琰.北京科技大学 2016
[2]基于深度学习的短文本分析与计算方法研究[D]. 李岩.北京科技大学 2016
[3]文本分类关键技术及应用研究[D]. 凤丽洲.吉林大学 2015
硕士论文
[1]中文文本聚类关键技术研究[D]. 邵明来.广西大学 2015
[2]基于密度的层次聚类算法研究[D]. 张文开.中国科学技术大学 2015
[3]基于词向量的短文本分类方法研究[D]. 江大鹏.浙江大学 2015
[4]中文短文本分类技术的研究与实现[D]. 熊大康.安徽大学 2014
[5]基于复杂网络的中文文本分类研究[D]. 赵辉.西安电子科技大学 2014
[6]面向文本分类的特征提取算法研究[D]. 彭君睿.北京邮电大学 2014
[7]基于听觉图像的音乐流派自动分类系统研究[D]. 李秋颖.天津大学 2012
本文编号:3532031
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3532031.html