基于深度学习的协议识别技术研究
发布时间:2021-06-01 07:22
随着互联网的高速发展,通信传输能力日新月异,网络移动应用层出不穷,社会生活与网络之间越发密不可分。在网络发展的同时,网络恶意攻击活动如木马程序、蠕虫病毒等也随之升级扩大,在一定程度上影响了广大互联网用户的体验,情况严重时还会给企业造成损失,给社会带来危害,因此网络中的通信安全是如今的中心议题。而在网络安全领域中,协议识别是其他技术工作如漏洞挖掘、入侵检测等的前提基础,对保障网络中通信安全具有重要意义,近年来成为了科研人员的研究重点。现在网络环境中存在大量私有协议,其协议规范尚未公开,传统的协议识别技术都存在一定缺陷。基于端口的协议识别技术需要知晓预定义端口号,而目前的动态端口技术等使得端口不再固定;基于载荷和基于行为特征的协议识别技术需要大量的人力投入,特征统计繁杂。这些因素导致传统的协议识别技术已不满足当前高速便捷的要求。本文针对大规模应用层协议自动化精确识别的需求,借鉴目前较为成熟的深度学习相关方法展开研究,即分类中使用的卷积神经网络和聚类中使用的自编码器,分别构建了有监督的分类模型和无监督的聚类模型。本文详细研究工作如下:1.研究了基于卷积神经网络的协议识别技术,此技术针对的数据...
【文章来源】:中国工程物理研究院北京市
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.3部分神经网络结构??y:?=?f(wn]?■?X1?+?wi2?■?x2?+???X3?+???x4?+?Z?(l))?=?f{W^X+b(]))?(2-3)??
是指卷积祌经网络中每一层输出特征图中一个点对应输入一片区域的映射,从而每个??神经元不需要同输入的全部进行关联,只需最后对所有局部信息进行综合即可,这样??大大减少了神经元连接数量,降低了计算量;权值共享是指不同神经元之间的参数相??同,其可行的原因是提取的特征同特征在输入的原始位置无关,这样大大减少了参数??个数;池化是指进行下采样得到特征降维,从而加快了运算速度并降低了过拟合的风??险。卷积神经网络在完成对数据学习的过程具有稳定、无需转换数据类型的优点。??卷积神经网络基本结构如图2.4所示。??输入?特征映射?输出??I?I?I?I?I?I??唇r化|\、??卷枳£?降采样S?卷织尝?降采样S?全连括S??图2.4卷积神经网络基本结构??卷积神经网络的结构中,包含了卷积层(Convolutional?Layer?),降采样层??(PoolingLayer)和全连接层(Fully?Connected?Layer)。??卷积层用于提取出输入数据的特征,卷积层中每个神经元都同上次一层神经元进??行部分连接,然后使用卷积滤波器进行二维卷积操作,卷积层中的二维卷积操作定义??如式(2-5)所示:??(2-5)??m?n??而数学上定义的二维卷积表达式如式(2-6)所示:??s(i,j)?=?(^?*?W){iJ)?=?(2_??m?n??15??
了一个翻转的操作,即将卷积核进行上下左右翻转180??度,但实际上这是不影响的。原因在于对于卷积核W,我们开始就可以就使用翻转后??的W'进行式(2-5)的卷积,得到的结果和直接使用W进行式(2-5)的卷积一样,这就想??当于没有翻转。因此我们可以使用更为直观简便的(2-6)卷积操作。??降米样层用于减小提取到的特征的维度,即通常所说的下米样(Subsampling),??一般使用最大采样(Max?Pooling)或均值采样(Mean?Pooling),以减少输入矩阵的长??和宽,如图2.5的降采样层,就是选择2*2区域内的最大值输出到下一层,从而将2N*2N??的特征图压缩到N*N。最后的全连接层用于输出特征向量以完成分类或检索等任务。??□?□□□??□?口1〇13—?-?□??□□□□?□□??□?□□□??图2.5降釆样层示意图??协议特征提取和分类模型建立是有监督式协议识别领域中两个研宄重点,因此快??速提取合理的协议特征、高效建立正确的分类模型是我们的目标。但是在第一章中所??提到的另外三种协议识别技术都存在识别协议种类较少、识别效率较低等问题。因此??网络协议识别领域在近年来使用机器学习方法的文献越来越多,针对有标记的协议数??据或者说协议规范己知的协议识别,这些方法能取得一定的效果,但大部分都采用人??为设计特征[4()’41],这样不仅增加网络协议识别的工作量,同样还不能保证识别的准确??率。而卷积神经网络根据打上标签的训练数据集提取特征,这正是一个解决这个问题??的合适工具。?:??2_2.3白编码器??自编码器是一种前馈神经网络,在此基础上可以构建多种复杂的模型,包括栈式??16??
【参考文献】:
期刊论文
[1]融合特征降维和密度峰值的二进制协议数据帧聚类算法[J]. 闫小勇,李青. 小型微型计算机系统. 2018(12)
[2]自编码器理论与方法综述[J]. 贾文娟,张煜东. 计算机系统应用. 2018(05)
[3]中国互联网络发展状况统计报告[J]. 中国科技信息. 2018(05)
[4]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
[5]网络流量分类方法研究[J]. 镇佳,朱国胜. 信息通信. 2017(08)
[6]基于改进凝聚层次聚类的协议分类算法[J]. 张凤荔,周洪川,张俊娇,刘渊,张春瑞. 计算机工程与科学. 2017(04)
[7]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[8]网络加密流量识别研究综述及展望[J]. 潘吴斌,程光,郭晓军,黄顺翔. 通信学报. 2016(09)
[9]针对私有协议的模糊测试技术研究[J]. 彭勇,王婷,熊琦,戴忠华,伊胜伟,高海辉. 北京交通大学学报. 2013(05)
[10]自适应网络应用特征发现方法[J]. 王变琴,余顺争. 通信学报. 2013(04)
硕士论文
[1]深度包检测技术的研究与设计[D]. 刘胤.贵州大学 2008
本文编号:3209934
【文章来源】:中国工程物理研究院北京市
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.3部分神经网络结构??y:?=?f(wn]?■?X1?+?wi2?■?x2?+???X3?+???x4?+?Z?(l))?=?f{W^X+b(]))?(2-3)??
是指卷积祌经网络中每一层输出特征图中一个点对应输入一片区域的映射,从而每个??神经元不需要同输入的全部进行关联,只需最后对所有局部信息进行综合即可,这样??大大减少了神经元连接数量,降低了计算量;权值共享是指不同神经元之间的参数相??同,其可行的原因是提取的特征同特征在输入的原始位置无关,这样大大减少了参数??个数;池化是指进行下采样得到特征降维,从而加快了运算速度并降低了过拟合的风??险。卷积神经网络在完成对数据学习的过程具有稳定、无需转换数据类型的优点。??卷积神经网络基本结构如图2.4所示。??输入?特征映射?输出??I?I?I?I?I?I??唇r化|\、??卷枳£?降采样S?卷织尝?降采样S?全连括S??图2.4卷积神经网络基本结构??卷积神经网络的结构中,包含了卷积层(Convolutional?Layer?),降采样层??(PoolingLayer)和全连接层(Fully?Connected?Layer)。??卷积层用于提取出输入数据的特征,卷积层中每个神经元都同上次一层神经元进??行部分连接,然后使用卷积滤波器进行二维卷积操作,卷积层中的二维卷积操作定义??如式(2-5)所示:??(2-5)??m?n??而数学上定义的二维卷积表达式如式(2-6)所示:??s(i,j)?=?(^?*?W){iJ)?=?(2_??m?n??15??
了一个翻转的操作,即将卷积核进行上下左右翻转180??度,但实际上这是不影响的。原因在于对于卷积核W,我们开始就可以就使用翻转后??的W'进行式(2-5)的卷积,得到的结果和直接使用W进行式(2-5)的卷积一样,这就想??当于没有翻转。因此我们可以使用更为直观简便的(2-6)卷积操作。??降米样层用于减小提取到的特征的维度,即通常所说的下米样(Subsampling),??一般使用最大采样(Max?Pooling)或均值采样(Mean?Pooling),以减少输入矩阵的长??和宽,如图2.5的降采样层,就是选择2*2区域内的最大值输出到下一层,从而将2N*2N??的特征图压缩到N*N。最后的全连接层用于输出特征向量以完成分类或检索等任务。??□?□□□??□?口1〇13—?-?□??□□□□?□□??□?□□□??图2.5降釆样层示意图??协议特征提取和分类模型建立是有监督式协议识别领域中两个研宄重点,因此快??速提取合理的协议特征、高效建立正确的分类模型是我们的目标。但是在第一章中所??提到的另外三种协议识别技术都存在识别协议种类较少、识别效率较低等问题。因此??网络协议识别领域在近年来使用机器学习方法的文献越来越多,针对有标记的协议数??据或者说协议规范己知的协议识别,这些方法能取得一定的效果,但大部分都采用人??为设计特征[4()’41],这样不仅增加网络协议识别的工作量,同样还不能保证识别的准确??率。而卷积神经网络根据打上标签的训练数据集提取特征,这正是一个解决这个问题??的合适工具。?:??2_2.3白编码器??自编码器是一种前馈神经网络,在此基础上可以构建多种复杂的模型,包括栈式??16??
【参考文献】:
期刊论文
[1]融合特征降维和密度峰值的二进制协议数据帧聚类算法[J]. 闫小勇,李青. 小型微型计算机系统. 2018(12)
[2]自编码器理论与方法综述[J]. 贾文娟,张煜东. 计算机系统应用. 2018(05)
[3]中国互联网络发展状况统计报告[J]. 中国科技信息. 2018(05)
[4]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
[5]网络流量分类方法研究[J]. 镇佳,朱国胜. 信息通信. 2017(08)
[6]基于改进凝聚层次聚类的协议分类算法[J]. 张凤荔,周洪川,张俊娇,刘渊,张春瑞. 计算机工程与科学. 2017(04)
[7]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[8]网络加密流量识别研究综述及展望[J]. 潘吴斌,程光,郭晓军,黄顺翔. 通信学报. 2016(09)
[9]针对私有协议的模糊测试技术研究[J]. 彭勇,王婷,熊琦,戴忠华,伊胜伟,高海辉. 北京交通大学学报. 2013(05)
[10]自适应网络应用特征发现方法[J]. 王变琴,余顺争. 通信学报. 2013(04)
硕士论文
[1]深度包检测技术的研究与设计[D]. 刘胤.贵州大学 2008
本文编号:3209934
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3209934.html