基于条件生成对抗网络的移动应用流量分类识别关键技术研究
发布时间:2021-02-14 04:32
随着移动网络新时代的到来,移动设备上的APP种类和数量正在急速增长,相应的移动流量也呈现爆发式的增长。流量的识别与分类是网络管理和网络安全领域的重要研究内容。运营商需要根据带宽中的各类流量的占比进行动态访问控制,为客户提供更好的用户体验。安全监管部门需要实时检测网络流量中的恶意流量,避免其造成严重损失。在流量分类领域的研究中,随着端口伪装、随机端口技术的出现,传统基于端口的流量分类方法迅速失效;基于净荷特征的方法也因为加密流量的出现而失去作用。于是有学者开始将机器学习应用于流量分类问题上,如尝试使用朴素贝叶斯、SVM支持向量机、决策树、随机森林等方法对流统计特征或时序特征进行特征提取和分类模型的训练。在这些研究中,特征的提取往往依赖于领域专家人工设计,特征设计的好坏会对模型学习产生较大影响。同时作为一种人工手段,不仅耗时耗力,在样本流量有限的情况下对流量非线性特征的表达能力有限。因此传统机器学习手段对人工特征设计及数据集的依赖较大。然而在流量采集过程中,捕获的流量往往是不纯净的,需要在繁杂的网络流量中过滤出需要的数据,并对其进行标注,这个过程需要耗费大量的时间和人力。同时由于各类应用的...
【文章来源】:南京邮电大学江苏省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
GAN网络结构
南京邮电大学硕士研究生学位论文3基于条件生成对抗网络的移动应用流量分类系统框架9第三章基于条件生成对抗网络的移动应用流量分类系统为了研究移动流量分类问题,需要采集各类APP的流量样本。但网络中的流量并不是均匀分布,且一些冷门APP的流量样本往往很难采集,这就会导致采集样本出现类别不平衡问题。这种不平衡问题大大影响了小类别应用的识别准确率。而这些小类别样本往往不容忽视,如恶意攻击、木马软件流量等。因此流量样本生成机制的研究具有重大意义。系统流程本文提出了基于条件生成对抗网络的移动应用流量分类系统,其基本流程如图3.1所示:图3.1基于条件生成对抗网络的移动应用流量分类系统框基于条件生成对抗网络的移动应用流量分类系统,首先通过基于流量分组的流量图像转换方法对输入的数据集进行处理。按分组逐步读取Pcap包中的流量信息,过滤出无效数据。对剩下的数据进行截断或填充以保证所有数据长度相同,保证最后生成的图片大小也相同。将得到的流量图像送入基于条件生成对抗网络的样本生成模型PacketCGAN,利用生成对抗网络的“博弈理论”学习流量图像的样本特征。当PacketCGAN达到纳什均衡后结束训练并根据流量标签控制生成器生成一定数量的小类别流量图像样本数据。将生成的流量图像样本和原流量图像样本混合后得到平衡数据集,以试图消除不平衡数据集对流量分类带来的影响。最后将得到的平衡数据集送入基于深度学习的分类模型,即可实现对流量更为精准的分类。本文通过PacketCGAN与不平衡数据集和其他传统数据平衡方法分类效果的对比,验证了PacketCGAN方法的优越性。
南京邮电大学硕士研究生学位论文3基于条件生成对抗网络的移动应用流量分类系统框架10基于流量分组的流量图像转换方法图像识别技术发展到今天,从刚开始仅仅对数字手写体、符号、字母等识别,慢慢发展到已经在工业界有了大量实际应用,如手机上的FaceID、公安部门的人脸识别系统、汽车的无人驾驶等。图像识别算法的发展已经相当成熟,为了将图像识别与流量分类结合,本文设计了将Pcap包中的流量数据转为流量图像的预处理模块,该模块的框架如图3.2所示:图3.2流量预处理模块框架图该方法通过Pacp文件及相关协议规范,获取流量中的分组信息。并根据报头包含的信息对流量进行过滤,剔除无用的流量分组。对数据进行截断或补零,规范数据长度,以保证模型的输入维度一致。将数据按照规则转换后即可得到各分组对应的单通道灰度流量图像和三通道流量图像。基于条件生成对抗网络的移动流量样本生成模型:PacketCGAN对转换后得到的流量图像,做成数据集后即可用来训练PacketCGAN神经网络。该方法利用生成对抗网络能够生成新数据的特点来平衡数据集。由于GAN的生成器和判别器互相博弈的特点,不平衡的数据集并不会影响PacketCGAN训练效果。除了传统生成对抗网络模型中的生成器和判别器外,本文对PacketCAGN中生成器和判别器的网络结构进行改进,加入了卷积神经网络,以试图根据训练好的判别器中的卷积神经网络,结合Softmax分类器实现对流量的分类。PacketCGAN的框架如图3.3所示:
【参考文献】:
期刊论文
[1]基于堆栈式自动编码器的加密流量识别方法[J]. 王攀,陈雪娇. 计算机工程. 2018(11)
[2]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
[3]基于载荷特征的加密流量快速识别方法[J]. 陈伟,胡磊,杨龙. 计算机工程. 2012(12)
硕士论文
[1]基于深度学习的网络流量识别关键技术研究[D]. 李玎.战略支援部队信息工程大学 2018
本文编号:3033119
【文章来源】:南京邮电大学江苏省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
GAN网络结构
南京邮电大学硕士研究生学位论文3基于条件生成对抗网络的移动应用流量分类系统框架9第三章基于条件生成对抗网络的移动应用流量分类系统为了研究移动流量分类问题,需要采集各类APP的流量样本。但网络中的流量并不是均匀分布,且一些冷门APP的流量样本往往很难采集,这就会导致采集样本出现类别不平衡问题。这种不平衡问题大大影响了小类别应用的识别准确率。而这些小类别样本往往不容忽视,如恶意攻击、木马软件流量等。因此流量样本生成机制的研究具有重大意义。系统流程本文提出了基于条件生成对抗网络的移动应用流量分类系统,其基本流程如图3.1所示:图3.1基于条件生成对抗网络的移动应用流量分类系统框基于条件生成对抗网络的移动应用流量分类系统,首先通过基于流量分组的流量图像转换方法对输入的数据集进行处理。按分组逐步读取Pcap包中的流量信息,过滤出无效数据。对剩下的数据进行截断或填充以保证所有数据长度相同,保证最后生成的图片大小也相同。将得到的流量图像送入基于条件生成对抗网络的样本生成模型PacketCGAN,利用生成对抗网络的“博弈理论”学习流量图像的样本特征。当PacketCGAN达到纳什均衡后结束训练并根据流量标签控制生成器生成一定数量的小类别流量图像样本数据。将生成的流量图像样本和原流量图像样本混合后得到平衡数据集,以试图消除不平衡数据集对流量分类带来的影响。最后将得到的平衡数据集送入基于深度学习的分类模型,即可实现对流量更为精准的分类。本文通过PacketCGAN与不平衡数据集和其他传统数据平衡方法分类效果的对比,验证了PacketCGAN方法的优越性。
南京邮电大学硕士研究生学位论文3基于条件生成对抗网络的移动应用流量分类系统框架10基于流量分组的流量图像转换方法图像识别技术发展到今天,从刚开始仅仅对数字手写体、符号、字母等识别,慢慢发展到已经在工业界有了大量实际应用,如手机上的FaceID、公安部门的人脸识别系统、汽车的无人驾驶等。图像识别算法的发展已经相当成熟,为了将图像识别与流量分类结合,本文设计了将Pcap包中的流量数据转为流量图像的预处理模块,该模块的框架如图3.2所示:图3.2流量预处理模块框架图该方法通过Pacp文件及相关协议规范,获取流量中的分组信息。并根据报头包含的信息对流量进行过滤,剔除无用的流量分组。对数据进行截断或补零,规范数据长度,以保证模型的输入维度一致。将数据按照规则转换后即可得到各分组对应的单通道灰度流量图像和三通道流量图像。基于条件生成对抗网络的移动流量样本生成模型:PacketCGAN对转换后得到的流量图像,做成数据集后即可用来训练PacketCGAN神经网络。该方法利用生成对抗网络能够生成新数据的特点来平衡数据集。由于GAN的生成器和判别器互相博弈的特点,不平衡的数据集并不会影响PacketCGAN训练效果。除了传统生成对抗网络模型中的生成器和判别器外,本文对PacketCAGN中生成器和判别器的网络结构进行改进,加入了卷积神经网络,以试图根据训练好的判别器中的卷积神经网络,结合Softmax分类器实现对流量的分类。PacketCGAN的框架如图3.3所示:
【参考文献】:
期刊论文
[1]基于堆栈式自动编码器的加密流量识别方法[J]. 王攀,陈雪娇. 计算机工程. 2018(11)
[2]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
[3]基于载荷特征的加密流量快速识别方法[J]. 陈伟,胡磊,杨龙. 计算机工程. 2012(12)
硕士论文
[1]基于深度学习的网络流量识别关键技术研究[D]. 李玎.战略支援部队信息工程大学 2018
本文编号:3033119
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3033119.html