SDN环境下不同机器学习算法的网络流量分类分析
发布时间:2024-05-14 05:33
为对比分析软件定义网络(SDN)环境下不同机器学习算法的网络流量分类效果,对Moore数据集进行了平衡处理,在机器学习平台RapidMiner上对K-近邻(KNN)、随机森林(RF)、支持向量机(SVM)和梯度提升决策树(GBDT) 4种经典机器学习算法选取不同的分类特征进行分类实验.实验结果表明,较其他3种算法,GBDT算法可以在较短的时间内获得更好的分类效果.
【文章页数】:7 页
【部分图文】:
本文编号:3973257
【文章页数】:7 页
【部分图文】:
图1Borderline-SMOTE算法流程
因本文中使用的Moore数据集中GAME类型与其他类型样本量差距太大,即使使用Borderline-SMOTE算法也无法避免样本重叠,所以在进行实验时,剔除了标记为GAME类型的样本,然后选取WWW类型部分样本和其他类型的全部样本组成新的训练数据集,采用Borderline-SM....
图2不同算法对各种特征的分类准确率
不同算法对各种特征的分类准确率如图2所示.由图2可以看出,在对网络流量进行分类时,不同的特征对识别准确率的影响很大,基于端口号的识别方法、基于时间信息的识别方法和基于信息标志位的识别方法无论在何种机器学习方法下识别率均不高,而将数据包数量、数据包大小等网络流量统计信息作为分类特征....
图3不同算法对组合特征的分类准确率
本文在机器学习平台RapidMiner上验证了SDN环境下KNN、SVM、RF和GBDT这4种算法的网络流量分类效果.实验结果表明,GBDT算法利用每次学习的残差进行迭代训练,相较于其他3种算法具有更好的分类效果和较短的训练时间.SDN的网络可重构能力为将GBDT算法作为功能模块....
图4不同算法的训练时间
图3不同算法对组合特征的分类准确率
本文编号:3973257
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3973257.html