未知网络协议识别技术研究
发布时间:2021-02-21 20:00
近年移动终端的逐渐普及和网络的蓬勃发展催生了新型互联网结构的诞生,促进了网络流量的增长。在如此庞大的网络背后,对网络流量的有效监管是网络安全保护的基石。目前网络监管方向的许多研究都专注于未知网络协议类型的分析,与机器学习相结合的协议识别方法是此类研究中的热点,该方法提取数据流特征并建立数据集,使用机器学习的算法模型分析未知网络流量,可以得到相对于传统网络协议分析方法更好的识别效果。本文的研究主要聚焦于不同协议类型和应用数据加密方法的分析。不同的数据流由于其承载应用的不同,在持续时间,数据分布,应用数据安全性,客户端、服务端交互等特性上都会存在一些差别。针对这些差别,本文提出一种识别算法模型实现对不同协议流、不同应用密文加密算法类型的识别与分析。首先,针对未知网络协议识别问题,本文在深入研究K-Means算法后提出了基于KMeans算法聚类过程和离群点分析的未知协议识别算法模型。K-Means算法流程简单,运行高效,作用于大数据集上效果较好,但K-Means算法在流量识别中存在着一定缺陷:K-Means算法对初始聚类中心点的选择采取随机的策略;执行同样功能的数据流在不同的网络环境下会表现...
【文章来源】:哈尔滨工程大学黑龙江省 211工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
BT网络架构
25 streamTime 秒 数据流持续时间特征构建后将算法模型将对构建的数据集进行归一化处理,归一化处理可以避免不同特征维度间的数据差别影响聚类结果。由于上行下行数据包个数比率本身就处于 0-之间,故对除这两个特征之外的其他特征做归一化处理即可。构建完初始特征和归一化后,需要依据卡方检验对特征进行选择,选择合适的特征维度。在归一化处理和特征选择之后,即可以对离群点进行分析,在真实网络环境中,同样协议的流由于出现时间、网络带宽等诸多网络环境因素的影响,即使是执行相同功能例如打开同样的网页操作,也可能有完全不同的特征。当网络环境较好时,数据包按时按序到达,网页的打开,数据的上行、下行都能顺利的完成;而当网络环境较差时,可能会频繁的出现丢包情况,于是对于同样的流来说,数据量的传送,数据包的个数都会随之增加,甚至可能由于长时间的客户端、服务端的未响应,客户端的突然关闭等因素导致流在尚未结束的情况下终止了数据的发送。LOF 离群点算法将排除掉一些代表此类型流的样本点,这些流可能会影响到聚类结果的精确率。一系列由于程序异常终止而终止数据传输的流如图 3.3。
第 3 章 基于改进 K-Means++算法的未知协议识别-Means++聚类算法离群点分析时,需要针对每个点计算其局部可达密该样本点所处位置附近的样本点越多,点的密度越越大。针对于此结论,本文对 K-Means++聚类算法OF 离群点分析时,记录离群点分析过程中的平均的 K-Means++算法的初始聚类中心点,并用该方法法。若数据集中存在相同密度的样本点,则求所有近该质心的样本点来作为 K-Means++算法的初始聚所示。
【参考文献】:
期刊论文
[1]P2P网络技术在局域网中的应用分析[J]. 周俊. 电子世界. 2017(09)
[2]基于流量行为特征的异常流量检测[J]. 胡洋瑞,陈兴蜀,王俊峰,叶晓鸣. 信息网络安全. 2016(11)
[3]基于半监督聚类集成的未知网络协议识别方法[J]. 林荣强,李鸥,李青,刘琰. 小型微型计算机系统. 2016(06)
[4]基于密文随机性度量值分布特征的分组密码算法识别方案[J]. 吴杨,王韬,邢萌,李进东. 通信学报. 2015(04)
[5]移动互联网研究综述[J]. 吴吉义,李文娟,黄剑平,章剑林,陈德人. 中国科学:信息科学. 2015(01)
[6]基于快速求解高斯混合模型的流量聚类算法[J]. 党小超,毛鹏鑫,郝占军. 计算机工程与应用. 2015(08)
[7]基于Bayes决策的密码算法识别技术[J]. 李继中,蒋烈辉,尹青,刘铁铭,郭佳. 计算机工程. 2008(20)
[8]HTTP协议技术探析[J]. 肖戈林. 江西通信科技. 2001(01)
硕士论文
[1]未知协议感知的网络流量分类方法[D]. 阳水桥.浙江大学 2016
本文编号:3044844
【文章来源】:哈尔滨工程大学黑龙江省 211工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
BT网络架构
25 streamTime 秒 数据流持续时间特征构建后将算法模型将对构建的数据集进行归一化处理,归一化处理可以避免不同特征维度间的数据差别影响聚类结果。由于上行下行数据包个数比率本身就处于 0-之间,故对除这两个特征之外的其他特征做归一化处理即可。构建完初始特征和归一化后,需要依据卡方检验对特征进行选择,选择合适的特征维度。在归一化处理和特征选择之后,即可以对离群点进行分析,在真实网络环境中,同样协议的流由于出现时间、网络带宽等诸多网络环境因素的影响,即使是执行相同功能例如打开同样的网页操作,也可能有完全不同的特征。当网络环境较好时,数据包按时按序到达,网页的打开,数据的上行、下行都能顺利的完成;而当网络环境较差时,可能会频繁的出现丢包情况,于是对于同样的流来说,数据量的传送,数据包的个数都会随之增加,甚至可能由于长时间的客户端、服务端的未响应,客户端的突然关闭等因素导致流在尚未结束的情况下终止了数据的发送。LOF 离群点算法将排除掉一些代表此类型流的样本点,这些流可能会影响到聚类结果的精确率。一系列由于程序异常终止而终止数据传输的流如图 3.3。
第 3 章 基于改进 K-Means++算法的未知协议识别-Means++聚类算法离群点分析时,需要针对每个点计算其局部可达密该样本点所处位置附近的样本点越多,点的密度越越大。针对于此结论,本文对 K-Means++聚类算法OF 离群点分析时,记录离群点分析过程中的平均的 K-Means++算法的初始聚类中心点,并用该方法法。若数据集中存在相同密度的样本点,则求所有近该质心的样本点来作为 K-Means++算法的初始聚所示。
【参考文献】:
期刊论文
[1]P2P网络技术在局域网中的应用分析[J]. 周俊. 电子世界. 2017(09)
[2]基于流量行为特征的异常流量检测[J]. 胡洋瑞,陈兴蜀,王俊峰,叶晓鸣. 信息网络安全. 2016(11)
[3]基于半监督聚类集成的未知网络协议识别方法[J]. 林荣强,李鸥,李青,刘琰. 小型微型计算机系统. 2016(06)
[4]基于密文随机性度量值分布特征的分组密码算法识别方案[J]. 吴杨,王韬,邢萌,李进东. 通信学报. 2015(04)
[5]移动互联网研究综述[J]. 吴吉义,李文娟,黄剑平,章剑林,陈德人. 中国科学:信息科学. 2015(01)
[6]基于快速求解高斯混合模型的流量聚类算法[J]. 党小超,毛鹏鑫,郝占军. 计算机工程与应用. 2015(08)
[7]基于Bayes决策的密码算法识别技术[J]. 李继中,蒋烈辉,尹青,刘铁铭,郭佳. 计算机工程. 2008(20)
[8]HTTP协议技术探析[J]. 肖戈林. 江西通信科技. 2001(01)
硕士论文
[1]未知协议感知的网络流量分类方法[D]. 阳水桥.浙江大学 2016
本文编号:3044844
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3044844.html