面向聚类的堆叠降噪自动编码器的特征提取研究
发布时间:2017-12-21 10:48
本文关键词:面向聚类的堆叠降噪自动编码器的特征提取研究 出处:《现代计算机(专业版)》2016年33期 论文类型:期刊论文
【摘要】:为解决短文本聚类时文本的高维稀疏性问题,提出一种基于堆叠降噪自动编码器的短文本特征提取算法。该算法利用深度学习网络形式,把多个降噪自动编码器网络逐层堆叠起来,将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间。实验结果表明,将提取的文本特征应用于短文本聚类,显著提高聚类的效果。
【作者单位】: 郑州轻工业学院计算机与通信工程学院;
【基金】:国家自然科学基金青年科学基金项目(No.61201447)
【分类号】:TP391.1
【正文快照】: 0引言近年来,随着互联网技术的迅速发展和移动通信设备的广泛普及,以微博、微信、BBS等形式的短文本数量以指数级增长。短文本信息涵盖多个领域,如经济、政治、文化等,为人们搜索数据提供了很大的数据来源,但由于短文本本身具有样本数量多、词频单一、用词不规范、特征稀疏等
【相似文献】
中国期刊全文数据库 前4条
1 曲建岭;杜辰飞;邸亚洲;高峰;郭超然;;深度自动编码器的研究与展望[J];计算机与现代化;2014年08期
2 秦胜君;卢志平;;基于降噪自动编码器的不平衡情感分类研究[J];科学技术与工程;2014年12期
3 段宝彬;韩立新;;改进的深度卷积网络及在碎纸片拼接中的应用[J];计算机工程与应用;2014年09期
4 ;[J];;年期
中国硕士学位论文全文数据库 前5条
1 梁湘群;基于Gabor特征与深度自动编码器的笑脸识别方法[D];五邑大学;2015年
2 吴海燕;基于自动编码器的半监督表示学习与分类学习研究[D];重庆大学;2015年
3 林雨;极限学习机与自动编码器的融合算法研究[D];吉林大学;2016年
4 庞荣;深度神经网络算法研究及应用[D];西南交通大学;2016年
5 雒玉玺;稀疏自动编码器及其加速算法的研究[D];兰州大学;2014年
,本文编号:1315778
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1315778.html