基于SAE-LBP的网页分类研究
本文关键词:基于SAE-LBP的网页分类研究
更多相关文章: SAE LBP 网页分类 深度学习 神经网络
【摘要】:在网页分类技术中,SVM、BP神经网络和Naive Bayes等传统分类器主要采用了信息增益、互信息和最大熵等模型选取特征.随着深度学习的发展,深层次地选取特征的方法正在被广泛研究.结合稀疏自动编码器(SAE)和LBP神经网络,提出一种基于SAE-LBP的网页分类器.根据网页文本的半结构化特征,改进了文本特征表示的权重计算.针对网页文本的稀疏性,采用SAE对网页文本进行特征选取.还提出一种基于学习率自动调整的LBP神经网络,有效地降低了训练时间.实验表明,相对于传统的BP神经网络,基于SAE-LBP的网页分类器的分类正确率提升了5.19%,时间性能提升了83.86%.
【作者单位】: 中国科学技术大学计算机科学技术学院;中国科学技术大学安徽省计算与通信软件重点实验室;中国科学技术大学先进技术研究院;
【基金】:安徽省自然科学基金项目(1408085MKL06)资助
【分类号】:TP391.1;TP393.092
【正文快照】: 1引言随着互联网的发展,网页的数目呈现井喷状增加,也预示着大数据时代的到来.杂乱、大量的网页文本,不利于人们对信息的查找与过滤.为了方便对网页文本的检索与挖掘,对网页文本的分类就显得十分重要[1].针对网页文本分类已有不少相关研究,文献[2]中将网页文本分类描述成文本
【相似文献】
中国期刊全文数据库 前10条
1 刘蓉;周建中;;一种网页分类中基于图的半指导学习算法[J];计算机应用研究;2008年03期
2 汤亚玲;崔志明;;行为特征分析模式下的网页分类技术研究[J];计算机工程;2012年20期
3 朱志宁;黄青松;;快速的中文网页分类方法实现[J];山西电子技术;2008年04期
4 王振宇;唐远华;郭力;;面向分层结构的网页分类与抓取[J];计算机工程与科学;2012年11期
5 盛魁;;改进的K-近邻算法在中文网页分类的应用[J];佳木斯大学学报(自然科学版);2011年06期
6 陈胜荣;董守斌;;基于优选链接的中文网页分类方法研究[J];郑州大学学报(理学版);2007年02期
7 刘艳民;;中文网页分类方法的研究[J];微电子学与计算机;2009年09期
8 和雪芳;李长河;石争浩;;基于用户反馈的相关度调整算法[J];山东农业大学学报(自然科学版);2007年04期
9 孙玲芳;黎维良;;基于定题爬虫的网页分类的多级判定算法[J];科学技术与工程;2009年18期
10 蒋宗礼;时福林;;基于链接关系的网页分类优化算法[J];计算机与现代化;2014年05期
中国重要会议论文全文数据库 前3条
1 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
3 米晓芳;秦洋;王立宏;宋宜斌;;基于潜在语义差异的医学网页分类[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国硕士学位论文全文数据库 前10条
1 王晶;面向通信管理的电子政务系统及其网页分类的研究与实现[D];上海交通大学;2009年
2 张祥;一个网页分类系统的研究与实现[D];北京邮电大学;2013年
3 段昕;基于视觉特征中文网页分类方法的研究[D];山东大学;2007年
4 汪雷;基于文本挖掘的网页分类系统研究与实现[D];武汉理工大学;2013年
5 于成龙;中文网页分类及存储系统设计与实现[D];哈尔滨工业大学;2007年
6 张q;基于半监督的网页分类[D];哈尔滨工业大学;2013年
7 徐法艳;基于Web挖掘技术的网页分类研究[D];扬州大学;2008年
8 干文敏;基于Web挖掘的中文网页分类的研究与实现[D];南京航空航天大学;2012年
9 龚畅;基于web挖掘技术的网页分类研究[D];江南大学;2009年
10 朱菊花;中文网页分类技术的研究与实现[D];西南交通大学;2008年
,本文编号:1276382
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1276382.html