基于随机森林的数据库入侵检测研究
发布时间:2021-01-11 02:33
数据库是信息系统中极易被攻击的一个环节,其安全问题备受关注。入侵检测是安全技术的重要方法之一,也是数据库安全机制的组成部分。入侵检测的本质是分类,因此分类算法对入侵检测系统起着至关重要的作用。随机森林具有集成学习理论、高效数据处理能力和参数设置简单等优点。本文对随机森林算法在数据库入侵检测中的应用进行研究。本文介绍了数据库安防和入侵检测的相关内容,研究了数据库的常见攻击手段以及数据库入侵检测的主要技术,分析了决策树、梯度提升决策树和随机森林的三种分类算法应用于数据库入侵检测中的优缺点。针对随机森林算法元分类器精度不足的问题,本文给出了以梯度提升决策树作为元分类器的随机森林数据库入侵检测算法。在提升分类精度的同时,改进算法中对原始数据集进行的重采样处理,可以降低噪声数据的关联性,而其中的随机投票机制还可以从一定程度上过滤掉单个元分类器出现过拟合的情况,降低了整体模型出现过拟合的可能性。此外,针对单棵梯度提升决策树在数据库入侵检测应用中容易出现过拟合的问题,本文给出了通过相关参数,控制树的深度,进行剪枝操作,降低模型的复杂度的改进方案。为了验证改进算法的性能,本文选择了9组UCI公有数据集...
【文章来源】:河北大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
多阶段控制的数据库入侵容忍框架图
图 2-2 数据挖掘技术识别用户行为模式的过程示意图(2)数据挖掘中的聚类分析方法聚类分析能够将数据划分为不同的簇,并且在不同簇中寻找对象最大的相似化。对行为进行划分设置,使系统中不同的簇之间能够产生多种类别,就能够将正常行
基于数据挖掘的入侵检测流程图
本文编号:2969900
【文章来源】:河北大学河北省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
多阶段控制的数据库入侵容忍框架图
图 2-2 数据挖掘技术识别用户行为模式的过程示意图(2)数据挖掘中的聚类分析方法聚类分析能够将数据划分为不同的簇,并且在不同簇中寻找对象最大的相似化。对行为进行划分设置,使系统中不同的簇之间能够产生多种类别,就能够将正常行
基于数据挖掘的入侵检测流程图
本文编号:2969900
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2969900.html