网络流分类中的特征选择研究
发布时间:2024-04-21 07:56
随着网络技术的飞速发展,互联网的规模不断扩大,业务类型不断增加。一方面网络流量急剧增长,造成网络拥塞,导致网络服务质量下降,另一方面,种类繁多的网络应用,越来越占用网络资源,且给网络安全带来巨大威胁。为更好了解网络状况,及时处理网络故障,并对管理和优化网络配置提供依据,网络管理者需对不同网络应用进行及时、准确的分析,对网络行为进行有效的控制。实现这些的前提和基础是对网络流量的正确识别与分类。 目前,基于流统计特征的流量分类方法是研究热点,在这种方法中,定义和提取区分不同类型流量的有效特征与选择合适的分类方法是关键。这里的网络特征,既包含数据包特征也包含数据流特征。富含分类信息特征的选取,能提高分类精确度,同时,特征维度的降低,能减少后续分类器建模时间,提高分类速度。本文从人工分析选择特征和特征选择算法选择特征这两个方面展开研究。 首先,在Moore特征集的基础上,人工分析选择特征。本文将Moore特征集的特征按性质分为五个组,分组考察特征对网络流分类的贡献,找出关键特征组别,然后再逐步细化,区分出哪些特征对网络流分类具有相对更高的贡献度。为排除后续机器学习方法对分类的影响,实验时,选择...
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
本文编号:3960608
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3.1各组特征预测精确度对比图
3.3.1各组特征对分类的贡献度图3.1为5组网络流特征利用四种机器学习方法对Moore数据集进行分类的预测精确度对比。口Ports日PacketNumbers^PacketBytes^Time□TCPFlags90—------—----- — ....
图3.2基于端口特征的F-measure对比
对网络流分类有相对更高的预测精确度。对网络流分类时,除了整体预测精确度,我们还关注分类中各个类别流量的分类情况。图3.2和图3.3所示为使用端口特征和与分组长度相关特征配合k-NN和C4.5决策树方法,数据集中各类别应用的分类情况,评价指标为综合考虑查全率和查准率的F-mea....
图3.3基于分组长度相关特征的F-measure对比
对网络流分类有相对更高的预测精确度。对网络流分类时,除了整体预测精确度,我们还关注分类中各个类别流量的分类情况。图3.2和图3.3所示为使用端口特征和与分组长度相关特征配合k-NN和C4.5决策树方法,数据集中各类别应用的分类情况,评价指标为综合考虑查全率和查准率的F-mea....
本文编号:3960608
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3960608.html