一种HTTPS应用的层次分类方法
发布时间:2021-07-01 07:11
HTTPS协议用以网站服务器的身份认证,提供交换数据的保密性和完整性。然而一些不法分子利用HTTPS页面散布不良信息,这给通信流量的管理和安全分析带来了新的挑战。因此,准确识别基于SSL/TLS的HTTPS加密应用,对于提高网络服务质量、优化网络带宽分配、加强安全管控有着重要意义。现有的方法大多侧重于直接识别网站和应用程序,而很少关注类别的层次性结构。本文提出一种根据HTTPS应用类别的树状层次结构,自顶向下,逐层分类识别的方法,在顶层根据签名和样本流的关联关系将业务流识别为对应的大类,在次顶层提取检测流的特征值,使用随机森林模型分类为对应的最底层子类。实验结果表明,该方法能克服直接识别方法分类误差高的缺点,提高业务识别的精确率。
【文章来源】:网络新媒体技术. 2020,9(03)
【文章页数】:7 页
【部分图文】:
HTTPS应用层次结构
本文提出一个多层次的HTTPS应用分类方法-MLCM(Multi-level Classification Method)。在树状的分类体系中,在顶层,采用证书域名签名分类识别应用的提供者,次顶层为每一个提供者构建机器学习分类器分类子应用。多层次HTTPS应用分类的整体结构如图2所示。在预处理阶段,需要训练顶层和次顶层的分类器,顶层分类器的训练旨在建立签名和流的匹配表,次顶层分类器根据流的统计特征建立分类模型。步骤①-步骤⑦展示了实际应用场景中应用识别的流程,步骤1负责对网络中的SSL/TLS流量进行提取并对流进行重组,步骤2提取流的证书域信息签名,步骤3对业务流进行第一次分类,步骤4得出分类的应用提供者。并且为了防止无法识别重连的SSL/TLS会话(无证书和密钥交换信息),需要收集会话Session ID和服务器IP的对应集,并给予应用提供者标识,这是在步骤4a做的操作。步骤5提取应用流的统计特征,步骤6运用应用提供者的特定模型精确的识别应用,步骤7输出次顶层分类器识别的结果。1.1 顶层分类
由于加密流量的不确定性,因此很难对其进行识别。有很多关于HTTPS流量分类的研究,他们都偏向直接识别应用,忽略了应用本身的层次信息。本文提出一种基于签名和流特征的层次分类方法-MLCM,来对HTTPS应用进行精细分类识别。该方法能克服单一签名或流特征识别HTTPS应用精度不够且容易产生误报的缺点,且对网络中实际产生的流量分类性能较好。在未来的工作中,我们计划研究其他可用于签名的SSL/TLS字段和识别HTTPS应用的流特征,提高识别性能。图4 SCU_DATASET分类结果
【参考文献】:
期刊论文
[1]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
[2]基于特征加权的朴素贝叶斯流量分类方法研究[J]. 张泽鑫,李俊,常向青. 高技术通讯. 2016(02)
[3]使用贝叶斯学习算法分类网络流量[J]. 邱密,阳爱民,刘永定,何震凯. 计算机工程与应用. 2010(25)
硕士论文
[1]基于深度学习的网络流量识别关键技术研究[D]. 李玎.战略支援部队信息工程大学 2018
[2]Website指纹识别攻击与防护技术研究[D]. 吴家顺.南京理工大学 2013
本文编号:3258690
【文章来源】:网络新媒体技术. 2020,9(03)
【文章页数】:7 页
【部分图文】:
HTTPS应用层次结构
本文提出一个多层次的HTTPS应用分类方法-MLCM(Multi-level Classification Method)。在树状的分类体系中,在顶层,采用证书域名签名分类识别应用的提供者,次顶层为每一个提供者构建机器学习分类器分类子应用。多层次HTTPS应用分类的整体结构如图2所示。在预处理阶段,需要训练顶层和次顶层的分类器,顶层分类器的训练旨在建立签名和流的匹配表,次顶层分类器根据流的统计特征建立分类模型。步骤①-步骤⑦展示了实际应用场景中应用识别的流程,步骤1负责对网络中的SSL/TLS流量进行提取并对流进行重组,步骤2提取流的证书域信息签名,步骤3对业务流进行第一次分类,步骤4得出分类的应用提供者。并且为了防止无法识别重连的SSL/TLS会话(无证书和密钥交换信息),需要收集会话Session ID和服务器IP的对应集,并给予应用提供者标识,这是在步骤4a做的操作。步骤5提取应用流的统计特征,步骤6运用应用提供者的特定模型精确的识别应用,步骤7输出次顶层分类器识别的结果。1.1 顶层分类
由于加密流量的不确定性,因此很难对其进行识别。有很多关于HTTPS流量分类的研究,他们都偏向直接识别应用,忽略了应用本身的层次信息。本文提出一种基于签名和流特征的层次分类方法-MLCM,来对HTTPS应用进行精细分类识别。该方法能克服单一签名或流特征识别HTTPS应用精度不够且容易产生误报的缺点,且对网络中实际产生的流量分类性能较好。在未来的工作中,我们计划研究其他可用于签名的SSL/TLS字段和识别HTTPS应用的流特征,提高识别性能。图4 SCU_DATASET分类结果
【参考文献】:
期刊论文
[1]基于深度卷积神经网络的网络流量分类方法[J]. 王勇,周慧怡,俸皓,叶苗,柯文龙. 通信学报. 2018(01)
[2]基于特征加权的朴素贝叶斯流量分类方法研究[J]. 张泽鑫,李俊,常向青. 高技术通讯. 2016(02)
[3]使用贝叶斯学习算法分类网络流量[J]. 邱密,阳爱民,刘永定,何震凯. 计算机工程与应用. 2010(25)
硕士论文
[1]基于深度学习的网络流量识别关键技术研究[D]. 李玎.战略支援部队信息工程大学 2018
[2]Website指纹识别攻击与防护技术研究[D]. 吴家顺.南京理工大学 2013
本文编号:3258690
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3258690.html