面向网络入侵检测的特征选择方法研究
发布时间:2020-12-23 01:11
随着网络技术的飞速发展,网络环境存在着海量数据,所以网络安全问题显得尤为重要。网络环境不安全会导致隐私泄露和资源盗用等诸多问题发生,给人们的工作生活带来许多损失。因此,网络入侵检测成为了一个研究热点。网络入侵检测通过对网络信息进行分析从而发现是否存在违反安全策略的行为和被攻击的迹象。网络入侵数据的特征选择对于网络入侵检测而言是至关重要的一个环节,直接影响着后期检测的效果。网络入侵数据维数高和数据规模大等特点会使其计算成本增加,其中的冗余属性和不相关属性,还会影响检测的效果。针对上述存在的问题,本文针对网络入侵检测技术,提出了两个特征选择算法来提高入侵检测的效率。主要研究内容如下:(1)针对粗糙集的特征选择问题,提出了一个基于信息增益和粗糙集相结合的特征选择算法来降低时间复杂度。该算法先利用信息增益算法删除冗余属性,再使用粗糙集理论求得特征子集,并对多数类和少数类进行特征选择,选出对少数类别影响较大的属性,加入求得的特征子集中,作为最终结果。最后使用随机森林分类器进行分类,进行仿真实验。实验结果表明,基于信息增益和粗糙集相结合的算法不仅能够有效的删除冗余和不相关的属性,降低了计算成本,而...
【文章来源】:辽宁师范大学辽宁省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图2.1?LLE算法流程图??Fig.?2.1?Flow?chart?of?LLE?algorithm??LLE算法认为每一个样本点都可以由其近邻点的线性加权组合构造得到,具??
图2.?2朴素贝叶斯分类的流程??Fig.?2.2?Flow?chart?of?naive?Bayes?classification??备阶段,这个阶段主要是做分类前的准备工作。首先,在整个样样本作为训练集,再将选取的训练集输入分类器中,这个阶段都,训练样本的选取会对分类有一定的影响。其实分类器的质量很征属性、特征属性划分及训练样本的质量。??练阶段,这个阶段的核心就是产生分类器,主要是将准备阶段输进行运算,计算类别出现的频率以及特征划分类别的条件概率,习过程。这一阶段不需要人工完成,是由程序自动完成的。??类阶段。这个阶段主要是使用训练阶段产生的分类器对待分类样入的是分类器和无标签的样本,输出是该样本的标签,这个标签出来的。这一阶段也是不需要人工完成。??使用预测的标签和原始的标签进行对比,得到各种评价标准。??树??(Decision?Tree,?DT/431是一种被普遍应用的机器学习方法。决策
能处理连续的数据。因此,实验先对数据进行离散化处理,然后对整体数据做归??一化处理,再进行特征选择,最后利用随机森林分类器进行分类检测。经过对随??机森林分类器的参数A进行寻优分析,实验结果如图3.1和图3.2所示,本章选??择hlO为最终实验参数。??搬??§?,??55??56??B4??K-l?k=5?k=10?k=50?k=lCK)?k-500?k=1000??图3.1不M参数A下的准确中.??Fig.3.1?Accuracy?ofcliHerenl?parameters?k??19??
本文编号:2932786
【文章来源】:辽宁师范大学辽宁省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图2.1?LLE算法流程图??Fig.?2.1?Flow?chart?of?LLE?algorithm??LLE算法认为每一个样本点都可以由其近邻点的线性加权组合构造得到,具??
图2.?2朴素贝叶斯分类的流程??Fig.?2.2?Flow?chart?of?naive?Bayes?classification??备阶段,这个阶段主要是做分类前的准备工作。首先,在整个样样本作为训练集,再将选取的训练集输入分类器中,这个阶段都,训练样本的选取会对分类有一定的影响。其实分类器的质量很征属性、特征属性划分及训练样本的质量。??练阶段,这个阶段的核心就是产生分类器,主要是将准备阶段输进行运算,计算类别出现的频率以及特征划分类别的条件概率,习过程。这一阶段不需要人工完成,是由程序自动完成的。??类阶段。这个阶段主要是使用训练阶段产生的分类器对待分类样入的是分类器和无标签的样本,输出是该样本的标签,这个标签出来的。这一阶段也是不需要人工完成。??使用预测的标签和原始的标签进行对比,得到各种评价标准。??树??(Decision?Tree,?DT/431是一种被普遍应用的机器学习方法。决策
能处理连续的数据。因此,实验先对数据进行离散化处理,然后对整体数据做归??一化处理,再进行特征选择,最后利用随机森林分类器进行分类检测。经过对随??机森林分类器的参数A进行寻优分析,实验结果如图3.1和图3.2所示,本章选??择hlO为最终实验参数。??搬??§?,??55??56??B4??K-l?k=5?k=10?k=50?k=lCK)?k-500?k=1000??图3.1不M参数A下的准确中.??Fig.3.1?Accuracy?ofcliHerenl?parameters?k??19??
本文编号:2932786
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2932786.html