基于降噪自动编码器的中文新闻文本分类方法研究
本文关键词:基于降噪自动编码器的中文新闻文本分类方法研究,由笔耕文化传播整理发布。
【摘要】:【目的】借助深度学习理论,解决传统特征选择方法容易导致特征项不明确、分类精度下降的问题。【方法】对中文新闻文本进行分类时,使用降噪自动编码器构建一个深层网络来学习对文本的压缩及分布式的表示,并在网络最后一层采用SVM算法将其分类到具体的类别中去。【结果】随着样本数目的增大,分类准确率、召回率和F值都在上升,且比KNN算法、BP算法和SVM算法取得了更优的分类效果,平均分类准确率达到95%以上。【局限】数据量依然较小,且并没有完全发挥深度学习并行处理大容量数据的优势。【结论】该方法能提高特征项提取的准确性,并能提高分类效果。
【作者单位】: 江苏大学科技信息研究所;
【关键词】: 降噪自动编码器 支持向量机 特征提取 文本分类
【基金】:教育部人文社会科学研究青年基金项目“基于超图模型的专利文本多标签分类研究”(项目编号:14YJC870014)的研究成果之一
【分类号】:TP391.1
【正文快照】:
【参考文献】
中国期刊全文数据库 前8条
1 汪彩霞;魏雪云;王彪;;基于堆栈降噪自动编码模型的动态纹理分类方法[J];现代电子技术;2015年06期
2 刘勘;袁蕴英;;基于自动编码器的短文本特征提取及聚类研究[J];北京大学学报(自然科学版);2015年02期
3 胡帅;袁志勇;肖玲;王惠玲;王高华;;基于改进的多层降噪自编码算法临床分类诊断研究[J];计算机应用研究;2015年05期
4 秦胜君;卢志平;;基于降噪自动编码器的不平衡情感分类研究[J];科学技术与工程;2014年12期
5 辛竹;周亚建;;文本分类中互信息特征选择方法的研究与算法改进[J];计算机应用;2013年S2期
6 郭颂;马飞;;文本分类中信息增益特征选择算法的改进[J];计算机应用与软件;2013年08期
7 李学相;;改进的最大熵权值算法在文本分类中的应用[J];计算机科学;2012年06期
8 裴英博;刘晓霞;;文本分类中改进型CHI特征选择方法的研究[J];计算机工程与应用;2011年04期
【共引文献】
中国期刊全文数据库 前10条
1 刘红光;马双刚;刘桂锋;;基于降噪自动编码器的中文新闻文本分类方法研究[J];现代图书情报技术;2016年06期
2 闫健卓;李鹏英;方丽英;龙丽英;刘欣悦;;基于X~2统计的改进文本特征选择方法[J];计算机工程与设计;2016年05期
3 万中英;王明文;左家莉;万剑怡;;结合全局和局部信息的特征选择算法[J];山东大学学报(理学版);2016年05期
4 汪滢;李昆仑;熊婷;陈炼;;引入高阶累积量的数据库访问特征选择算法[J];科学技术与工程;2016年05期
5 谢霖铨;梁博群;;基于降噪自编码的推荐算法[J];计算机与现代化;2016年02期
6 宋钰婷;徐德华;;基于LDA和SVM的中文文本分类研究[J];现代计算机(专业版);2016年05期
7 李振兴;王松;;基于卡方特征和BTM融合的短文本分类方法[J];兰州交通大学学报;2016年01期
8 章宁;;短文本的情报价值评估方法研究[J];舰船电子工程;2016年01期
9 吴金源;冀俊忠;赵学武;吴晨生;杜芳华;;基于特征选择技术的情感词权重计算[J];北京工业大学学报;2016年01期
10 高原;刘辉;樊孝忠;牛振东;;基于代码库和特征匹配的函数名称推荐方法[J];软件学报;2015年12期
【二级参考文献】
中国期刊全文数据库 前10条
1 邱云飞;王琳颍;邵良杉;郭红梅;;基于微博短文本的用户兴趣建模方法[J];计算机工程;2014年02期
2 张开旭;周昌乐;;基于自动编码器的中文词汇特征无监督学习[J];中文信息学报;2013年05期
3 王志昊;王中卿;李寿山;李培峰;;不平衡情感分类中的特征选择方法研究[J];中文信息学报;2013年04期
4 袁兴梅;杨明;杨杨;;一种面向不平衡数据的结构化SVM集成分类器[J];模式识别与人工智能;2013年03期
5 杨婉霞;孙理和;黄永峰;;结合语义与统计的特征降维短文本聚类[J];计算机工程;2012年22期
6 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[J];中文信息学报;2012年03期
7 马奎俊;韩彦军;陶卿;王珏;;基于核的慢特征分析算法[J];模式识别与人工智能;2011年02期
8 江海洋;;基于评论挖掘和用户偏好学习的评分预测协同过滤[J];计算机应用研究;2010年12期
9 范小丽;刘晓霞;;文本分类中互信息特征选择方法的研究[J];计算机工程与应用;2010年34期
10 王国才;张聪;;一种基于粗糙集的特征加权朴素贝叶斯分类器[J];重庆理工大学学报(自然科学版);2010年07期
【相似文献】
中国期刊全文数据库 前4条
1 曲建岭;杜辰飞;邸亚洲;高峰;郭超然;;深度自动编码器的研究与展望[J];计算机与现代化;2014年08期
2 秦胜君;卢志平;;基于降噪自动编码器的不平衡情感分类研究[J];科学技术与工程;2014年12期
3 段宝彬;韩立新;;改进的深度卷积网络及在碎纸片拼接中的应用[J];计算机工程与应用;2014年09期
4 ;[J];;年期
中国硕士学位论文全文数据库 前3条
1 梁湘群;基于Gabor特征与深度自动编码器的笑脸识别方法[D];五邑大学;2015年
2 吴海燕;基于自动编码器的半监督表示学习与分类学习研究[D];重庆大学;2015年
3 雒玉玺;稀疏自动编码器及其加速算法的研究[D];兰州大学;2014年
本文关键词:基于降噪自动编码器的中文新闻文本分类方法研究,由笔耕文化传播整理发布。
,本文编号:480979
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/480979.html