基于特征分组聚类的异常入侵检测系统研究

发布时间：2021-08-30 08:46

　　利用网络连接数据可以按照连接的基本特征、内容特征、网络流量特征和主机流量特征进行分组的特点,基于K-means算法,提出一种按照特征分组进行聚类的方法,以高效实现特征约简和数据降维。通过调整聚类参数保留特征分组内的差异信息,使用决策树C4.5算法对降维后的数据进行入侵分类处理。实验结果表明,该方法能够使kddcup99数据集的聚类特征数由41个降为4个,且对网络连接数据的总检测率为99.73%,误检率为0,其中正常网络连接和刺探攻击Probe的检测率均为100%。

【文章来源】：计算机工程. 2020,46(04)北大核心CSCD

【文章页数】：7 页

【部分图文】：

基于特征分组聚类的异常入侵检测系统研究

KBFG-C4.5入侵检测系统模型

数据属性,示例,数据

首先对实验数据进行预处理,预处理包含2个部分,即标称属性值数值化和所有数据归一化;然后依据数据的特征类型将数据分离成4个新的数据集,即l=4,如图2所示;接着对处理后的数据使用算法2进行降维,将数据转化为图2中用簇号表示的一条数据,如图中C1,6表示该样本第一个特征分组数据经过KBFG算法被聚到簇6中,以此类推;最后使用C4.5算法对高层抽象之后的数据进行分类,输出结果。4.1 KBFG分组聚类参数确定

模型图,检测率,模型,数据

在KBFG算法中,各分组的聚类数目kt(1≤t≤l)的取值由人工确定。通过反复实验,约定所有分组的聚类数目相等,即k1=k2=…=kt=…=kl =k。当k=5,6,7,8,9,10时,图3所示为KBFG-C4.5模型对攻击类连接数据的检测率情况。从图3可以看出,当k=10时KBFG-C4.5模型检测率 DDR=0.997 3,对比k=9时降低 0.003 0。当k=5,6,7,8,9,10时,图4所示为KBFG-C4.5模型对5种连接数据的检测率情况。从图4可以看出,当k=10时,R2L的DDR=0.330 9,对比 k=9时降低约0.030 0,当k=10时,DoS的DDR=0.999 3,对比 k=9时提高约0.030 0。Normal、U2R、Probe 的DDR在k=10、k=9时均无明显变化。图4 KBFG-C4.5模型对5种连接数据的检测率情况

【参考文献】：
期刊论文
[1]基于BFOA和K-means的复合入侵检测算法[J]. 肖苗苗,魏本征,尹义龙.  山东大学学报(工学版). 2018(03)
[2]一种面向入侵检测的半监督聚类算法[J]. 夏战国,万玲,蔡世玉,孙鹏辉.  山东大学学报(工学版). 2012(06)
[3]一种改进初始聚类中心选择的K-means算法[J]. 陈光平,王文鹏,黄俊.  小型微型计算机系统. 2012(06)
[4]基于特征分组加权聚类的表情识别[J]. 武宇文,刘宏,查红彬.  计算机辅助设计与图形学学报. 2005(11)
[5]基于无监督聚类的入侵检测方法[J]. 罗敏,王丽娜,张焕国.  电子学报. 2003(11)

本文编号：3372463

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/ydhl/3372463.html

上一篇：Web2.0环境下广西地税门户网站群的设计与实现
下一篇：基于地理定位的协同缓存移动P2P网络资源搜索策略研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|