基于近邻传播聚类的离群检测算法在入侵检测中的应用研究
本文选题:离群检测 + 近邻传播 ; 参考:《合肥工业大学》2017年硕士论文
【摘要】:近年来,数据挖掘中的许多方向都取得了不小的突破,在入侵检测领域也取得了不小的成果。但是在大多数研究的算法仅仅是针对数据集做一般模式的研究,然而在某些时候看来一些与数据集中大多数数据模式和行为不一致的数据点,也存在着非常重要的研究价值,这些点被称为离群点,由少量离群点组成的簇被称为离群簇。在数据挖掘中,使用某些算法将数据集中这些离群点或者离群簇检测出来的方法叫做离群检测。在网络环境中,网络入侵行为通常是网络行为中比例非常小的一部分行为,并且这部分行为会对网络环境带来一定的危害而且该行为本身就有别于正常行为,所以可以说网络入侵也属于离群行为。因此,这种特性为离群检测应用到入侵检测中提供了理论上的可行性。本文主要研究了基于近邻传播聚类的离群检测算法在入侵检测中的应用,详细介绍与分析国内外常用的离群检测算法,并对近邻传播算法做了详细的介绍;证明了该算法应用于离群检测的可行性,提出了基于近邻传播聚类的离群检测算法;并设计了基于离群检测的入侵检测算法模型与流程,通过AP算法先对数据集进行聚类然后进行聚类划分并计算离群指数,挖掘出入侵行为。通过一些列实验,验证了本文提出算法的有效性。本文的主要工作如下:(1)深入的研究了离群检测技术,分析了离群检测技术的现状,详细的阐述了离群检测技术的各种方法,并分析了这些方法的优缺点。(2)详细的介绍了近邻传播聚类算法,针对近邻传播算法的特点以及离群检测的特性与环境,验证了近邻传播算法应用于离群检测的可行性,提出了基于近邻传播聚类的离群检测算法。(3)深入的研究了入侵检测相关技术,并针对基于离群检测的入侵检测提出了相对应的算法模型与流程。(4)设计了基于近邻传播聚类的离群检测算法应用于入侵检测的实验方案,对网络入侵检测数据集KDD CUP 99进行了研究分析,并将算法与数据集用于实验,验证算法的效果。本文提出的ODAP算法应用于入侵检测环境中,并根据实验的准确率等指标进行评估。实验表明,基于近邻传播聚类的离群检测算法在入侵检测中有较好的效果。
[Abstract]:In recent years, great breakthroughs have been made in many fields of data mining, and great achievements have been made in the field of intrusion detection. However, in most researches, the algorithms only focus on the general schema of the data set. However, in some cases, some data points that are inconsistent with most of the data patterns and behaviors in the data set also have very important research value. These points are called outliers, and clusters composed of a few outliers are called outliers. In data mining, using some algorithms to detect outliers or outliers in data sets is called outlier detection. In the network environment, the network intrusion behavior is usually a very small part of the network behavior, and this part of the behavior will bring some harm to the network environment and the behavior itself is different from the normal behavior. So it can be said that network intrusion also belongs to outlier behavior. Therefore, this feature provides a theoretical feasibility for outlier detection in intrusion detection. This paper mainly studies the application of outlier detection algorithm based on nearest neighbor propagation clustering in intrusion detection, introduces and analyzes the common outlier detection algorithms at home and abroad in detail, and introduces the nearest neighbor propagation algorithm in detail. The feasibility of applying this algorithm to outlier detection is proved, and an outlier detection algorithm based on nearest neighbor propagation clustering is proposed, and an intrusion detection algorithm model and flow chart based on outlier detection are designed. First, the data set is clustered by AP algorithm, then the outlier index is calculated and the intrusion behavior is mined. The validity of the proposed algorithm is verified by some column experiments. The main work of this paper is as follows: (1) the outlier detection technology is deeply studied, the current situation of outlier detection technology is analyzed, and the various methods of outlier detection technology are described in detail. The advantages and disadvantages of these methods are analyzed. (2) the nearest neighbor propagation clustering algorithm is introduced in detail. According to the characteristics of the nearest neighbor propagation algorithm and the characteristics and environment of outlier detection, the feasibility of applying the nearest neighbor propagation algorithm to outlier detection is verified. An outlier detection algorithm based on nearest neighbor propagation clustering is proposed. Based on outlier detection, the corresponding algorithm model and flow chart are proposed. An experimental scheme of outlier detection based on nearest neighbor propagation clustering is designed. The network intrusion detection data set KDD CUP 99 is studied and analyzed, and the algorithm and data set are used in experiments to verify the effect of the algorithm. The ODAP algorithm proposed in this paper is applied to the intrusion detection environment and is evaluated according to the experimental accuracy. Experiments show that the outlier detection algorithm based on nearest neighbor propagation clustering is effective in intrusion detection.
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13;TP393.08
【相似文献】
相关期刊论文 前10条
1 魏藜,宫学庆,钱卫宁,周傲英;高维空间中的离群点发现[J];软件学报;2002年02期
2 薛安荣;姚林;鞠时光;陈伟鹤;马汉达;;离群点挖掘方法综述[J];计算机科学;2008年11期
3 李存华;;l_∞度量意义下的离群点检测[J];淮海工学院学报(自然科学版);2008年02期
4 李昕;颜学峰;;融合离群点判别的稳态检测方法及其应用[J];华东理工大学学报(自然科学版);2009年01期
5 封海岳;薛安荣;;基于重叠模块度的社区离群点检测[J];计算机应用与软件;2013年05期
6 王柏钧,王力勤;《稳健回归与离群点检测》介绍[J];成都气象学院学报;1989年04期
7 黄添强;秦小麟;叶飞跃;;基于方形邻域的离群点查找新方法[J];控制与决策;2006年05期
8 熊君丽;;高维空间下基于密度的离群点探测算法实现[J];现代电子技术;2006年15期
9 黄添强;秦小麟;王钦敏;;空间离群点的模型与跳跃取样查找算法[J];中国图象图形学报;2006年09期
10 陈光平;叶东毅;;一种改进的离群点检测方法[J];福州大学学报(自然科学版);2007年03期
相关会议论文 前9条
1 张锋;常会友;;茫然第三方支持的隐私保持离群点探测协议[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 连凤娜;吴锦林;薛永生;;一种改进的基于距离的离群挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 梁雪琴;刘红生;代秀梅;周亚芬;;聚类离群点挖掘技术在内部审计信息化中的应用——一个来自商业银行信用卡审计的实例[A];全国内部审计理论研讨优秀论文集(2013)[C];2014年
4 于浩;王斌;肖刚;杨晓春;;基于距离的不确定离群点检测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 许龙飞;熊君丽;段敏;;基于粗糙集的高维空间离群点发现算法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 刘文远;李振平;王宝文;裴继辉;;一种多维数据的离群点检测算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
7 魏藜;钱卫宁;周傲英;;HOT:寻找高维空间中的离群点[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
8 周红福;钱卫宁;魏藜;周傲英;;EDOLOIS:高效准确的子空间局部离群点发现[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 魏藜;钱卫宁;周傲英;;SLOT:基于估计的高效子空间局部离群点发现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
相关博士学位论文 前10条
1 刘莘;基于时空分析的CCS泄漏预警关键技术研究[D];中国矿业大学;2016年
2 刘露;异质信息网络中离群点检测方法研究[D];吉林大学;2017年
3 杨鹏;离群检测及其优化算法研究[D];重庆大学;2010年
4 林海;离群检测及离群释义空间查找算法研究[D];重庆大学;2012年
5 薛安荣;空间离群点挖掘技术的研究[D];江苏大学;2008年
6 杨茂林;离群检测算法研究[D];华中科技大学;2012年
7 金义富;高维稀疏离群数据集延伸知识发现研究[D];重庆大学;2007年
8 雷大江;离群检测与离群释义算法研究[D];重庆大学;2012年
9 万家强;基于连通性的离群检测与聚类研究[D];重庆大学;2014年
10 唐向红;数据流离群点检测研究[D];华中科技大学;2010年
相关硕士学位论文 前10条
1 韩红霞;基于距离离群点的分析与研究[D];江苏大学;2007年
2 黄馨玉;基于邻域重心变化的离群点检测算法研究[D];辽宁大学;2015年
3 程百球;基于EP模式的离群点发现[D];安庆师范学院;2015年
4 欧阳根平;Hadoop云平台下基于离群点挖掘的入侵检测技术研究[D];电子科技大学;2015年
5 邓璇;数据流挖掘关键技术研究与实现[D];电子科技大学;2015年
6 周莹莹;利用离群点检测改进协同过滤推荐算法[D];南京邮电大学;2015年
7 陈娟;基于离群特征提取和能量计算的SVM股市预测研究[D];合肥工业大学;2014年
8 张友强;基于选择性集成学习的离群点检测研究[D];青岛科技大学;2016年
9 王美晶;基于PSO算法的离群点检测方法研究[D];福州大学;2013年
10 关皓文;基于离群点检测方法的医保异常发现[D];山东大学;2016年
,本文编号:1866360
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1866360.html