基于集成学习与半监督学习的网络入侵检测方法的研究
发布时间:2021-09-02 11:10
作为保护网络安全的一项重要组成部分,网络入侵检测系统长期以来受到较高的重视。近年来,随着人工智能的普及,许多基于机器学习的技术被应用于网络入侵检测系统,并依赖于数据构建检测模型。这种数据驱动的方法虽然能够大幅度地减少人工识别的代价,却也存在着一些的问题。首先是原始数据质量参差不齐,网络入侵检测运用的数据大部分是网络流量数据,而流量数据的数量是巨大的,其中会存在着大量冗余及噪声数据,而数据特征中也存在着部分不必要的内容,这些部分极大地影响了检测模型的精度。其次,在构建检测模型时,由于流量数据中缺乏攻击行为,数据分布会严重不平衡,造成训练模型对攻击行为缺乏认知,泛化能力较弱,检测性能低下等问题。再次,大部分基于机器学习的检测模型采用了无监督学习或者有监督学习的方法构建模型,仅仅采用无监督学习方法,由于缺乏标签数据的引导,会造成模型的性能较差,准确率低,误报率高等问题。而仅仅采用有监督学习的方法,检测模型会依赖于标签数据,使其缺乏对新型攻击的认知,并且当标签数据匮乏时,会严重影响有监督学习方法的性能。针对于上述提出的问题,本文首先提出一种针对流量数据的处理办法,该数据处理方法中运用了PCA算...
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
不同PCA降维的维数对“KDDTest+”的预测结果,其中(a)为准确率的结果,(b)
华南理工大学硕士学位论文样本分类为正例,导致整体的预测结果较为不理想。当 时,准确率与检测率会稍微下降,同时伴随着误报率的升高,而造成这种现象的可能原因是当数据维度变大时,同时伴随着冗余数据的增多,因而造成预测结果变差。通过实验分析可知,在 NSL-KDD数据集上,采用降维维数 = 可以获得数据预测的最佳性能。
第六章 实验测试与分析表 6-7 降维前后的模型性能对比KDDTest+ KDDTest-21FSSLT 算法降维维数 20 No Reduction 20 No Reduction准确率 85.03% 74.22% 71.30% 52.09%检测率 87.85% 64.61% 83.37% 53.65%精确率 95.93% 91.01% 94.79% 87.64%误报率 4.94% 8.43% 20.82% 34.17%BLET 算法降维维数 20 No Reduction 20 No Reduction准确率 84.78% 77.33% 70.48% 61.16%检测率 85.26% 66.44% 78.93% 59.86%精确率 95.97% 96.06% 94.47% 95.04%误报率 4.73% 3.60% 20.82% 14.08%
【参考文献】:
期刊论文
[1]APT攻击分层表示模型[J]. 谭韧,殷肖川,廉哲,陈玉鑫. 计算机应用. 2017(09)
[2]基于大数据分析的APT攻击检测研究综述[J]. 付钰,李洪成,吴晓平,王甲生. 通信学报. 2015(11)
[3]集成学习算法的差异性及性能比较[J]. 李凯,崔丽娟. 计算机工程. 2008(06)
[4]基于数据挖掘和规划的智能网络入侵检测系统[J]. 任铮,陈志刚. 计算机工程与科学. 2006(03)
[5]入侵检测技术研究综述[J]. 卿斯汉,蒋建春,马恒太,文伟平,刘雪飞. 通信学报. 2004(07)
[6]网络攻击检测中的机器学习方法综述[J]. 覃爱明,胡昌振,谭惠民. 安全与环境学报. 2001(01)
本文编号:3378902
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
不同PCA降维的维数对“KDDTest+”的预测结果,其中(a)为准确率的结果,(b)
华南理工大学硕士学位论文样本分类为正例,导致整体的预测结果较为不理想。当 时,准确率与检测率会稍微下降,同时伴随着误报率的升高,而造成这种现象的可能原因是当数据维度变大时,同时伴随着冗余数据的增多,因而造成预测结果变差。通过实验分析可知,在 NSL-KDD数据集上,采用降维维数 = 可以获得数据预测的最佳性能。
第六章 实验测试与分析表 6-7 降维前后的模型性能对比KDDTest+ KDDTest-21FSSLT 算法降维维数 20 No Reduction 20 No Reduction准确率 85.03% 74.22% 71.30% 52.09%检测率 87.85% 64.61% 83.37% 53.65%精确率 95.93% 91.01% 94.79% 87.64%误报率 4.94% 8.43% 20.82% 34.17%BLET 算法降维维数 20 No Reduction 20 No Reduction准确率 84.78% 77.33% 70.48% 61.16%检测率 85.26% 66.44% 78.93% 59.86%精确率 95.97% 96.06% 94.47% 95.04%误报率 4.73% 3.60% 20.82% 14.08%
【参考文献】:
期刊论文
[1]APT攻击分层表示模型[J]. 谭韧,殷肖川,廉哲,陈玉鑫. 计算机应用. 2017(09)
[2]基于大数据分析的APT攻击检测研究综述[J]. 付钰,李洪成,吴晓平,王甲生. 通信学报. 2015(11)
[3]集成学习算法的差异性及性能比较[J]. 李凯,崔丽娟. 计算机工程. 2008(06)
[4]基于数据挖掘和规划的智能网络入侵检测系统[J]. 任铮,陈志刚. 计算机工程与科学. 2006(03)
[5]入侵检测技术研究综述[J]. 卿斯汉,蒋建春,马恒太,文伟平,刘雪飞. 通信学报. 2004(07)
[6]网络攻击检测中的机器学习方法综述[J]. 覃爱明,胡昌振,谭惠民. 安全与环境学报. 2001(01)
本文编号:3378902
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3378902.html