当前位置:主页 > 管理论文 > 移动网络论文 >

基于Bootstrapping的因特网流量分类方法

发布时间:2018-05-03 07:18

  本文选题:半监督学习 + 类别不平衡 ; 参考:《北京邮电大学学报》2014年05期


【摘要】:针对因特网流量分类面临的流量类别标记瓶颈和类别样本数分布不平衡,提出基于Bootstrapping的流量分类方法,使用少量有标记样本训练初始分类器,迭代利用无标记样本扩展样本集并更新分类器.在构建扩展样本集过程中,将无标记样本在某后验概率分布下的正确分类行为视为一个概率事件,建立新的置信度计算方法,以减少扩展样本集中的噪声样本;基于概率近似正确学习理论建立启发式规则,注重选择小类样本加入扩展样本集,缓解类别样本数分布的不平衡.实验结果表明,与初始分类器相比,基于Bootstrapping的流量分类器总体分类准确率可提高9.46%;与现有半监督学习方法相比,小类分类准确率提高2.22%.
[Abstract]:Aiming at the bottleneck of traffic classification and the unbalanced distribution of class samples in Internet traffic classification, a new traffic classification method based on Bootstrapping is proposed, in which a small number of labeled samples are used to train the initial classifier. Iteratively using unlabeled samples to extend the sample set and update the classifier. In the process of constructing an extended sample set, the correct classification behavior of unlabeled samples under a posteriori probability distribution is regarded as a probability event, and a new confidence calculation method is established to reduce the noise samples in the extended sample set. Heuristic rules are established based on probabilistic approximate correct learning theory, and small class samples are selected to join the extended sample set to alleviate the imbalance in the distribution of the number of samples. The experimental results show that compared with the initial classifier, the overall classification accuracy of the flow classifier based on Bootstrapping can be improved by 9.46%, and the accuracy of subclass classification can be improved by 2.22 points compared with the existing semi-supervised learning methods.
【作者单位】: 华南理工大学软件学院;华南理工大学计算机科学与工程学院;
【基金】:国家自然科学基金项目(61171141)
【分类号】:TP393.06

【参考文献】

相关期刊论文 前2条

1 林平;余循宜;刘芳;雷振明;;基于流统计特性的网络流量分类算法[J];北京邮电大学学报;2008年02期

2 ;Network traffic classification based on ensemble learning and co-training[J];Science in China(Series F:Information Sciences);2009年02期

【共引文献】

相关期刊论文 前10条

1 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期

2 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期

3 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期

4 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期

5 蒋宗礼;徐学可;;一种基于集成学习与类指示器的文本分类方法[J];北京工业大学学报;2010年04期

6 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期

7 王新良;刘芳;马婧;雷振明;;僵尸网络指纹特征自动提取技术[J];北京邮电大学学报;2011年04期

8 李勇,王建波;分类回归树中分裂法则的相合性质[J];北京师范大学学报(自然科学版);2002年01期

9 任杰;柳毅;金鑫;别荣芳;;基于数据挖掘的蔬菜图片病害自动分类[J];北京师范大学学报(自然科学版);2006年06期

10 ;A rough sets based pruning method for bagging ensemble[J];重庆邮电大学学报(自然科学版);2008年03期

相关会议论文 前10条

1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年

2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年

3 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年

4 陈华杰;韦巍;;一种基于元泛化的Bagged Boosting算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年

5 ;Adaptive multi-LSSVR based soft sensing for cobalt oxalate synthesis process[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

6 ;Multiple ANNs Combined Scheme for Fault Diagnosis of Power Transformers[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

7 师凯;蔡延光;邹谷山;王涛;;蚁群算法及粒子群算法对比及在VRP中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年

8 刘峰;瞿俊;;基于聚类分析和神经网络的时间序列预测方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年

9 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

10 陈珊;李晓宁;梁逸曾;张志敏;;拉曼光谱的荧光背景扣除及其用于药物聚类分析[A];中国化学会第27届学术年会第09分会场摘要集[C];2010年

相关博士学位论文 前10条

1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年

2 冯光升;面向认知网络的自适应QoS感知与配置方法[D];哈尔滨工程大学;2009年

3 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年

4 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年

5 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年

6 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年

7 黄霄;支持多种网络体系的可重构路由交换平台及关键技术研究[D];解放军信息工程大学;2010年

8 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年

9 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年

10 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年

相关硕士学位论文 前10条

1 马冉冉;集成学习算法研究[D];山东科技大学;2010年

2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年

3 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年

4 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年

5 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年

6 吴正娟;特征变换在组合分类中的应用研究[D];郑州大学;2010年

7 曹彦;基于支持向量机的特征选择及其集成方法的研究[D];郑州大学;2010年

8 周驰;数据流上概念漂移的检测和分类[D];郑州大学;2010年

9 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年

10 刘晓飞;基于相关反馈的图像检索研究[D];大连理工大学;2010年

【相似文献】

相关期刊论文 前10条

1 周志华;;半监督学习专刊前言[J];软件学报;2008年11期

2 刘蓉;李红艳;;半监督学习研究与应用[J];软件导刊;2010年08期

3 陈武锦;;半监督学习研究综述[J];电脑知识与技术;2011年16期

4 李燕萍;唐振民;丁辉;张燕;;半监督学习机制下的说话人辨认算法[J];计算机工程;2009年14期

5 梁吉业;高嘉伟;常瑜;;半监督学习研究进展[J];山西大学学报(自然科学版);2009年04期

6 王劲松;陈哲;冯静兰;顾明亮;;半监督学习对十个口述数字的识别[J];电声技术;2010年04期

7 唐晓亮;韩敏;;一种基于极端学习机的半监督学习方法[J];大连理工大学学报;2010年05期

8 李欢;;半监督学习及其在数据挖掘中的应用[J];电脑知识与技术;2010年27期

9 郭利强;;网络博客空间中基于半监督学习的垃圾评论检测[J];图书情报工作;2012年04期

10 张燕;张晨光;张夏欢;;基于改进图半监督学习的个人信用评估方法[J];计算机科学与探索;2012年05期

相关会议论文 前10条

1 柳斌;李之棠;涂浩;;基于半监督学习的应用流分类方法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

2 葛荐;马廷淮;;基于集成算法的半监督学习研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

3 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

4 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

5 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年

6 陈耀东;王挺;陈火旺;;半监督学习和主动学习相结合的浅层语义分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年

8 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

9 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年

10 林良宪;利德江;蔡孟璇;邱政贤;;针对小样本分类的半监督式学习法[A];第25届全国灰色系统会议论文集[C];2014年

相关博士学位论文 前10条

1 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年

2 孔怡青;半监督学习及其应用研究[D];江南大学;2009年

3 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年

4 唐晓亮;基于神经网络的半监督学习方法研究[D];大连理工大学;2009年

5 余国先;高维数据上的半监督学习研究[D];华南理工大学;2013年

6 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年

7 王娇;多视图的半监督学习研究[D];北京交通大学;2010年

8 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年

9 薛贞霞;支持向量机及半监督学习中若干问题的研究[D];西安电子科技大学;2009年

10 吕佳;基于局部学习的半监督分类问题研究[D];内蒙古大学;2012年

相关硕士学位论文 前10条

1 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年

2 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年

3 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年

4 易星;半监督学习若干问题的研究[D];清华大学;2004年

5 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年

6 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年

7 梁,

本文编号:1837534


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1837534.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c3a4b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com