基于机器学习的网络入侵检测技术研究
发布时间:2023-02-09 19:16
随着互联网的飞速发展,智能化的信息时代为恶意人员的数据泄露、网络攻击等行为提供了更多可能性,网络安全面临严峻挑战。入侵检测是用于检测计算机网络系统中的入侵行为的新型信息安全技术,基于机器学习的入侵检测方法相比于传统的基于规则的方法能更好地识别未知的异常以及应对大数据时代庞大且复杂的日志数据。本文以NSL-KDD网络入侵检测数据集为研究对象,研究了采用决策树(Decision Tree,DT)、随机森林(Random Forests,RF)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、极端梯度提升决策树(e Xtreme Gradient Boosting,XGBoost)和支持向量机(Support Vector Machine,SVM)五种机器学习算法进行网络入侵检测,并设计了基于树模型+Boruta模式的新型特征选择算法来提升五种机器学习模型的检测效果,为实际网络入侵检测项目提供参考与指导。本文首先对NSL-KDD数据集进行预处理,用XGBoost实现特征选择,通过网格搜索技术寻找决策树、随机森林、GBDT、XGBoost、SVM五种...
【文章页数】:93 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 绪论
1.1 课题背景及意义
1.2 国内外发展历史及现状
1.3 发展方向
1.4 本文主要研究内容
1.5 本文的组织结构
2 入侵检测研究理论基础
2.1 数据预处理和特征选择概述
2.1.1 数据预处理的必要性与常用方法
2.1.2 特征选择的必要性与常用方法
2.2 入侵检测模型评估指标
2.3 模型参数优化方法
2.3.1 交叉验证
2.3.2 网格搜索
2.4 Person相关系数
2.5 机器学习模型理论基础
2.5.1 决策树
2.5.2 随机森林
2.5.3 GBDT
2.5.4 XGBoost
2.5.5 SVM
2.6 本章小结
3 基于树模型+Boruta模式的特征选择算法
3.1 Boruta特征选择算法
3.1.1 传统Boruta算法
3.1.2 BorutaShap
3.1.3 BoostARoota
3.2 树模型+BoostARoota算法思想及设计
3.3 树模型+CatBoruta算法
3.3.1 CatBoost算法
3.3.2 CatBoruta算法思想及设计
3.3.3 树模型+CatBoruta算法思想及设计
3.4 本章小结
4 实验对比与分析
4.1 数据集描述与预处理方法
4.1.1 数据集描述
4.1.2 数据预处理方法
4.2 XGBoost特征选择效果分析
4.3 机器学习模型参数寻优
4.3.1 随机森林参数寻优
4.3.2 决策树参数寻优
4.3.3 SVM参数寻优
4.3.4 GBDT参数寻优
4.3.5 XGBoost参数寻优方法
4.4 基于机器学习的网络入侵检测实验
4.5 实验结果对比与分析
4.5.1 XGBoost特征选择方案
4.5.2 树模型+BoostARoota特征选择方案
4.5.3 树模型+CatBoruta特征选择方案
4.6 本章小结
5 总结与展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集
本文编号:3739101
【文章页数】:93 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 绪论
1.1 课题背景及意义
1.2 国内外发展历史及现状
1.3 发展方向
1.4 本文主要研究内容
1.5 本文的组织结构
2 入侵检测研究理论基础
2.1 数据预处理和特征选择概述
2.1.1 数据预处理的必要性与常用方法
2.1.2 特征选择的必要性与常用方法
2.2 入侵检测模型评估指标
2.3 模型参数优化方法
2.3.1 交叉验证
2.3.2 网格搜索
2.4 Person相关系数
2.5 机器学习模型理论基础
2.5.1 决策树
2.5.2 随机森林
2.5.3 GBDT
2.5.4 XGBoost
2.5.5 SVM
2.6 本章小结
3 基于树模型+Boruta模式的特征选择算法
3.1 Boruta特征选择算法
3.1.1 传统Boruta算法
3.1.2 BorutaShap
3.1.3 BoostARoota
3.2 树模型+BoostARoota算法思想及设计
3.3 树模型+CatBoruta算法
3.3.1 CatBoost算法
3.3.2 CatBoruta算法思想及设计
3.3.3 树模型+CatBoruta算法思想及设计
3.4 本章小结
4 实验对比与分析
4.1 数据集描述与预处理方法
4.1.1 数据集描述
4.1.2 数据预处理方法
4.2 XGBoost特征选择效果分析
4.3 机器学习模型参数寻优
4.3.1 随机森林参数寻优
4.3.2 决策树参数寻优
4.3.3 SVM参数寻优
4.3.4 GBDT参数寻优
4.3.5 XGBoost参数寻优方法
4.4 基于机器学习的网络入侵检测实验
4.5 实验结果对比与分析
4.5.1 XGBoost特征选择方案
4.5.2 树模型+BoostARoota特征选择方案
4.5.3 树模型+CatBoruta特征选择方案
4.6 本章小结
5 总结与展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集
本文编号:3739101
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3739101.html