GBDT与LR融合模型在加密流量识别中的应用
发布时间:2021-06-15 16:42
随着网络应用服务类型的多样化以及网络流量加密技术的不断发展,加密流量识别已经成为网络安全领域的一个重大挑战。传统的流量识别技术如深度包检测无法有效地识别加密流量,而基于机器学习理论的加密流量识别技术则表现出很好的效果。因此,本文提出一种融合梯度提升决策树算法(GBDT)与逻辑回归(LR)算法的加密流量分类模型,使用贝叶斯优化(BO)算法进行超参数调整,利用与时间相关的流特征对普通加密流量与VPN加密流量进行识别,实现了整体高于90%的流量识别准确度,与其他常用分类模型相比拥有更好的识别效果。
【文章来源】:计算机与现代化. 2020,(03)
【文章页数】:6 页
【部分图文】:
GBDT-LR模型训练示意图
在GBDT算法中,每一次迭代的预测值都是将之前所有决策树的预测值以串行的方式累加的,新决策树是向拟合之前决策树的残差的方向形成。在一系列的决策树形成过程中,结点分裂会首先关注于能区分多数样本的特征,然后关注于能区分少数样本的特征。这种先选用整体上有区分度的特征,再选用对少数样本有区分度的特征的方式用于特征工程是比较合理的。因此,新的特征同时包含了能区分多数样本和少数样本的特征,这种策略刚好适用于特征工程。3 基于GBDT与LR融合模型的加密流量识别
GBDT-LR分类器训练流程图
【参考文献】:
期刊论文
[1]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
本文编号:3231417
【文章来源】:计算机与现代化. 2020,(03)
【文章页数】:6 页
【部分图文】:
GBDT-LR模型训练示意图
在GBDT算法中,每一次迭代的预测值都是将之前所有决策树的预测值以串行的方式累加的,新决策树是向拟合之前决策树的残差的方向形成。在一系列的决策树形成过程中,结点分裂会首先关注于能区分多数样本的特征,然后关注于能区分少数样本的特征。这种先选用整体上有区分度的特征,再选用对少数样本有区分度的特征的方式用于特征工程是比较合理的。因此,新的特征同时包含了能区分多数样本和少数样本的特征,这种策略刚好适用于特征工程。3 基于GBDT与LR融合模型的加密流量识别
GBDT-LR分类器训练流程图
【参考文献】:
期刊论文
[1]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
本文编号:3231417
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3231417.html