基于卷积神经网络的Android流量分类方法
发布时间:2021-07-16 19:56
深度学习就是机器学习研究的过程,主要通过模拟人脑分析学习的过程对数据进行分析。目前,深度学习技术已经在计算机视觉、语音识别、自然语言处理等领域获得了较大发展,并且随着该技术的不断发展,为网络流量分类和异常检测带来了新的发展方向。移动智能手机与大家的生活息息相关,但是其存在的安全问题也日益凸显。针对传统机器学习算法对于流量分类需要人工提取特征、计算量大的问题,提出了基于卷积神经网络模型的应用程序流量分类算法。首先,将网络流量数据集进行数据预处理,去除无关数据字段,并使数据满足卷积神经网络的输入特性。其次,设计了一种新的卷积神经网络模型,从网络结构、超参数空间以及参数优化方面入手,构造了最优分类模型。该模型通过卷积层自主学习数据特征,解决了传统基于机器学习的流量分类算法中的特征选择问题。最后,通过CICAndmal2017网络公开数据集进行模型测试,相比于传统的机器学习流量分类模型,设计的卷积神经网络模型的查准率和查全率分别提高了2.93%和11.87%,同时在类精度、召回率以及F1分数方面都有较好的提升。
【文章来源】:通信技术. 2020,53(02)
【文章页数】:6 页
【部分图文】:
流量数据位图可视化效果
流量数据位图可视化效果
流量数据的实际概念是按层次结构组织的一维字节流。这类数据主要由字节、数据包、会话和结构信息组成。这类序列类型数据非常适合采用卷积神经网络进行流量分类。进一步地,预处理后的流量数据规模和每张图片的尺寸都类似于MNIST手写体识别数据信息,因此本文采用LeNet-5[10]的CNN结构,模型结构如图2所示。流量数据处理的具体过程如下。首先输入层接收IDX格式的流量图像信息,并适当调整像素值,让其由0~255直接转换为0~1,实现归一化。在卷积层C1运算处理时,流量数据经过卷积层C1,由尺寸为5×5的卷积核进行处理。由于C1层共具有32个通道,所以最终会生成32个尺寸为28×28的特征图。经过处理的特征图进入池化层P1,该层会对特征图进行一次2×2的最大值池化处理,最终生成为32个尺寸为14×14的特征图。经过池化操作的特征图进入第二个卷积层C2,该卷积层的卷积核尺寸与C1相同,都是5×5,但是该层共具有64个通道,所以最后会生成64个尺寸为14×14的特征图。然后进入第二个池化层P2,在此层会对特征图进行2×2的最大值池化操作,与P1层操作相同,所以共生成64个7×7的特征图;接着会被两个全连接层处理,最后输出数据其输出节点数分别为1 024和10。最后,使用一个Softmax函数将输出结果转换为0~1的概率值。CNN各层输入、输出及参数设置如表1所示。
本文编号:3287661
【文章来源】:通信技术. 2020,53(02)
【文章页数】:6 页
【部分图文】:
流量数据位图可视化效果
流量数据位图可视化效果
流量数据的实际概念是按层次结构组织的一维字节流。这类数据主要由字节、数据包、会话和结构信息组成。这类序列类型数据非常适合采用卷积神经网络进行流量分类。进一步地,预处理后的流量数据规模和每张图片的尺寸都类似于MNIST手写体识别数据信息,因此本文采用LeNet-5[10]的CNN结构,模型结构如图2所示。流量数据处理的具体过程如下。首先输入层接收IDX格式的流量图像信息,并适当调整像素值,让其由0~255直接转换为0~1,实现归一化。在卷积层C1运算处理时,流量数据经过卷积层C1,由尺寸为5×5的卷积核进行处理。由于C1层共具有32个通道,所以最终会生成32个尺寸为28×28的特征图。经过处理的特征图进入池化层P1,该层会对特征图进行一次2×2的最大值池化处理,最终生成为32个尺寸为14×14的特征图。经过池化操作的特征图进入第二个卷积层C2,该卷积层的卷积核尺寸与C1相同,都是5×5,但是该层共具有64个通道,所以最后会生成64个尺寸为14×14的特征图。然后进入第二个池化层P2,在此层会对特征图进行2×2的最大值池化操作,与P1层操作相同,所以共生成64个7×7的特征图;接着会被两个全连接层处理,最后输出数据其输出节点数分别为1 024和10。最后,使用一个Softmax函数将输出结果转换为0~1的概率值。CNN各层输入、输出及参数设置如表1所示。
本文编号:3287661
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3287661.html