基于时空特征与APNs的应用程序识别方法
发布时间:2021-07-23 12:23
随着网络流量的快速增长,骨干网络体系架构不断演进,扁平化、网状化和动态自适应成为网络架构设计和优化的一大趋势,使得本来未完善解决的应用程序识别问题再次面临巨大挑战。当前的应用程序识别方法往往面临着流量数据速度快和识别精度不高,以及加密流量识别困难等难题。本文基于时空特征与APNs的应用程序识别方法展开深入研究。为了提高识别的鲁棒性和精度,本文提出一种基于时空特征的应用程序识别方法,该方法直接以原始网络流量作为输入,分别使用CNN和LSTM混合模型同步且自动地提取空域特征和时序特征,然后将两个模型输出的向量进行拼接融合,最后由Softmax层根据融合后的特征向量识别应用程序。在USTC-TFC2016数据集上的实验结果表明,提出的方法对于恶意应用程序识别的正确率高达100%,相比于传统的CNN模型和LSTM模型分别提高了1.48%与2.37%。针对iOS系统服务的特殊性,提出了基于APNs(Apple Push Notification service)网络流量的应用程序识别方法,实现在应用程序本身未产生流量情形下识别应用程序。首先对网络流量进行流量过滤、时间序列转换和流量切分等预处理,...
【文章来源】:杭州电子科技大学浙江省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
荣耀手机禁止应用程序后台运行示意图
杭州电科技学硕学位论图4.8不同Burst阈值的识别正确率分析不同机器学习算法的性能和效率有助于选择识别APNs流量的最佳算法。每个算法的分类性能受多个因素影响如特征集和算法的参数。每个算法对不同的特征集所使用的最优参数也不尽相同。本章考虑了不同算法的基本参数对分类结果的影响,下面主要展示本实验中对分类器性能影响最大的参数。图4.9不同决策树数量的正确率比较首先分析分类器识别APNs流量的性能。比较了四种算法使用不同参数的性能。为了提高RF性能,比较了不同数量决策树的RF性能。如图4.9所示,RF的正确率浮动不超过4%,当决策树数量为150时,达到最高正确率98.90%;为了提高KNN的性能,比较了不同邻居数的KNN性能。如图4.10所示,当邻居数从1增加到5时,其正确率缓慢上升,当邻居数从6增加到23时,其正确率达到最大值98.39%,随后正确率随着邻53
杭州电科技学硕学位论图4.8不同Burst阈值的识别正确率分析不同机器学习算法的性能和效率有助于选择识别APNs流量的最佳算法。每个算法的分类性能受多个因素影响如特征集和算法的参数。每个算法对不同的特征集所使用的最优参数也不尽相同。本章考虑了不同算法的基本参数对分类结果的影响,下面主要展示本实验中对分类器性能影响最大的参数。图4.9不同决策树数量的正确率比较首先分析分类器识别APNs流量的性能。比较了四种算法使用不同参数的性能。为了提高RF性能,比较了不同数量决策树的RF性能。如图4.9所示,RF的正确率浮动不超过4%,当决策树数量为150时,达到最高正确率98.90%;为了提高KNN的性能,比较了不同邻居数的KNN性能。如图4.10所示,当邻居数从1增加到5时,其正确率缓慢上升,当邻居数从6增加到23时,其正确率达到最大值98.39%,随后正确率随着邻53
【参考文献】:
期刊论文
[1]网络空间安全大国战略2019新动向[J]. 崔传桢. 信息安全研究. 2019(06)
[2]应用时间序列分析进行网络负载预测[J]. 沈富可,张卫,常潘. 中山大学学报(自然科学版). 2009(S1)
[3]基于Apriori算法的流量识别特征自动提取方法[J]. 刘兴彬,杨建华,谢高岗,胡玥. 通信学报. 2008(12)
博士论文
[1]基于深度学习的网络流量分类及异常检测方法研究[D]. 王伟.中国科学技术大学 2018
本文编号:3299282
【文章来源】:杭州电子科技大学浙江省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
荣耀手机禁止应用程序后台运行示意图
杭州电科技学硕学位论图4.8不同Burst阈值的识别正确率分析不同机器学习算法的性能和效率有助于选择识别APNs流量的最佳算法。每个算法的分类性能受多个因素影响如特征集和算法的参数。每个算法对不同的特征集所使用的最优参数也不尽相同。本章考虑了不同算法的基本参数对分类结果的影响,下面主要展示本实验中对分类器性能影响最大的参数。图4.9不同决策树数量的正确率比较首先分析分类器识别APNs流量的性能。比较了四种算法使用不同参数的性能。为了提高RF性能,比较了不同数量决策树的RF性能。如图4.9所示,RF的正确率浮动不超过4%,当决策树数量为150时,达到最高正确率98.90%;为了提高KNN的性能,比较了不同邻居数的KNN性能。如图4.10所示,当邻居数从1增加到5时,其正确率缓慢上升,当邻居数从6增加到23时,其正确率达到最大值98.39%,随后正确率随着邻53
杭州电科技学硕学位论图4.8不同Burst阈值的识别正确率分析不同机器学习算法的性能和效率有助于选择识别APNs流量的最佳算法。每个算法的分类性能受多个因素影响如特征集和算法的参数。每个算法对不同的特征集所使用的最优参数也不尽相同。本章考虑了不同算法的基本参数对分类结果的影响,下面主要展示本实验中对分类器性能影响最大的参数。图4.9不同决策树数量的正确率比较首先分析分类器识别APNs流量的性能。比较了四种算法使用不同参数的性能。为了提高RF性能,比较了不同数量决策树的RF性能。如图4.9所示,RF的正确率浮动不超过4%,当决策树数量为150时,达到最高正确率98.90%;为了提高KNN的性能,比较了不同邻居数的KNN性能。如图4.10所示,当邻居数从1增加到5时,其正确率缓慢上升,当邻居数从6增加到23时,其正确率达到最大值98.39%,随后正确率随着邻53
【参考文献】:
期刊论文
[1]网络空间安全大国战略2019新动向[J]. 崔传桢. 信息安全研究. 2019(06)
[2]应用时间序列分析进行网络负载预测[J]. 沈富可,张卫,常潘. 中山大学学报(自然科学版). 2009(S1)
[3]基于Apriori算法的流量识别特征自动提取方法[J]. 刘兴彬,杨建华,谢高岗,胡玥. 通信学报. 2008(12)
博士论文
[1]基于深度学习的网络流量分类及异常检测方法研究[D]. 王伟.中国科学技术大学 2018
本文编号:3299282
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3299282.html