使用自组织增量径向基网络的在线网络流量分类算法
发布时间:2024-02-03 12:23
针对传统流量分类方法存在模型训练速度慢、样本标记成本高和难以满足分类实时性的问题,构建了一种在线的半监督流量分类算法——OSOINN-RBF。首先使用改进的自组织增量神经网络对数据进行在线增量式的无监督学习,获得代表流量数据分布的SOINN网络,SOINN中节点的权重和半径分别作为径向基网络隐藏层节点的中心和半径;径向基网络能够捕获数据中难以发现的规律性,具有良好的泛化能力和学习收敛速度;最后使用少部分标记样本调节径向基网络输出层的权重,提高径向基网络的分类性能。实验结果证明,与主流分类算法相比,OSOINN-RBF算法的分类性能都为最优,具有最小的时间开销;面对未知流量类别时,OSOINN-RBF算法相比SOINN算法的分类准确率提高了5%~7%。
【文章页数】:9 页
【部分图文】:
本文编号:3894184
【文章页数】:9 页
【部分图文】:
图1流量分类框架
在流量分类的研究中广泛采用5元组定义流[13],即{源IP,目的IP,源端口,目的端口,传输层协议}。文献[8]对流中所有数据包进行统计特征分析,该方法只能用于离线的网络流量分类,不能满足实时在线的流量分类。本文提出了一种基于在线学习的网络流量分类框架,如图1所示。图中的数据预处....
图2神经元学习的2种情况
图2b所示的第2种情况是输入样本位于获胜神经元的半径内时,将建立这2个单元之间的连接,不再生成新的神经元。(2)拓扑学习。假设神经元连接关系集合C?N×N,当xt成为新生神经元,则更新神经元集合为N=N∪{i},若w1和w2不存在连接,获胜者和第二获胜者将建立连接,并将连接添加到....
图3OSOINN-RBF算法
式中:wk为隐藏单元的权重;核函数φk(x)用来衡量样本和样本之间的相似度。本文选择高斯核作为径向函数其中μk和σk是高斯核的超参数,分别代表隐藏单元k的中心与半径。
图4训练样本标记比例10%下的分类性能
为测试算法的在线学习能力与分类性能稳定性,图4、图5给出了不同算法的在线学习能力对比,其中图4为算法在训练样本标记比例为10%下的分类准确率,图5为算法在训练样本标记比例为20%下的分类准确率。可以看出,在样本标记比例10%的情况下,训练初期样本数较少时,K-means分类准确率....
本文编号:3894184
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3894184.html