基于AR优化的入侵检测模型研究
发布时间:2022-02-11 10:55
网络入侵检测作为一种可以防止、监督和抵抗系统入侵行为的安全机制,与其它防御性安全手段相比,具备实时性、动态性和智能性等特点。特征选择或降维的相关研究一直是入侵检测领域的热点之一,因为那些与被检测对象不相关的或冗余的特征可能含有噪声数据,会影响预测的效率和准确性。本论文通过详细地分析和比较几种特征选择算法,论证了Attribute Ratio(AR)在算法实现和优化效果等方面都表现更为优异。设计了三个采用AR优化的入侵检测模型,分别是K-Means聚类和随机森林相结合的模型、高斯混合聚类和随机森林相结合的模型以及按攻击类型分类的随机森林模型。详细地阐述了三个模型的组织结构和所涉及主要算法的原理及实现。深入研究了NSL-KDD数据集的结构和统计特性,并根据其特点进行了数据预处理和标准化。搭建了基于Python、Scikit-learn和PySpark等的仿真环境,完成了三个模型的仿真实验。实验结果表明三个基于AR优化的入侵检测模型在各个评价指标上都表现出较好的效果,相互之间性能差异很小。对交叉检验数据的检测,总体预测性能最优的是高斯混合和随机森林相结合的模型。对测试数据的检测,预测性能最优...
【文章来源】:兰州大学甘肃省211工程院校985工程院校教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
Accuracy与AR成负相关
图 2-2 AR、CFS、IG 和 GR 特征选择比较小结个分析了 CFS、IG、GR 和 AR 四个特征选择算法的计算验结果表明 AR 在预测的效率和准确率上都表现较为优下几个方面:一是 AR 的计算是四个算法里最简捷的,只分类中的均值或 01 频次;二是由于 AR 值是无量纲的,计算结果可以直接用于比较,生成特征子集效率较高;三相比优化性能更好。
士学位论文 基于 AR 优化的入侵检150。然后分别在各个类别中对随机森林分类器进行训练。由法对高维数据的聚类效果不理想,所以需要降维。首先通过 阈值为 0.05),选取的特征子集是 AR 字典(表 4-5)中的前 特征子集的基础上再通过 PCA 进行二次降维,确定高斯混合征子集。 还可以用来把数据可视化的处理。用 PCA 对训练集进行可视据集关于“attack”和“normal”两个标签的视图。图中红色al”的连接,灰色代表标签为“attack”的连接。
【参考文献】:
期刊论文
[1]随机森林中树的数量[J]. 刘敏,郎荣玲,曹永斌. 计算机工程与应用. 2015(05)
本文编号:3620151
【文章来源】:兰州大学甘肃省211工程院校985工程院校教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
Accuracy与AR成负相关
图 2-2 AR、CFS、IG 和 GR 特征选择比较小结个分析了 CFS、IG、GR 和 AR 四个特征选择算法的计算验结果表明 AR 在预测的效率和准确率上都表现较为优下几个方面:一是 AR 的计算是四个算法里最简捷的,只分类中的均值或 01 频次;二是由于 AR 值是无量纲的,计算结果可以直接用于比较,生成特征子集效率较高;三相比优化性能更好。
士学位论文 基于 AR 优化的入侵检150。然后分别在各个类别中对随机森林分类器进行训练。由法对高维数据的聚类效果不理想,所以需要降维。首先通过 阈值为 0.05),选取的特征子集是 AR 字典(表 4-5)中的前 特征子集的基础上再通过 PCA 进行二次降维,确定高斯混合征子集。 还可以用来把数据可视化的处理。用 PCA 对训练集进行可视据集关于“attack”和“normal”两个标签的视图。图中红色al”的连接,灰色代表标签为“attack”的连接。
【参考文献】:
期刊论文
[1]随机森林中树的数量[J]. 刘敏,郎荣玲,曹永斌. 计算机工程与应用. 2015(05)
本文编号:3620151
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3620151.html