基于多窗口机制的聚类异常检测算法
本文选题:单窗口 + 多窗口 ; 参考:《信息网络安全》2016年11期
【摘要】:文章通过分析单窗口聚类异常检测算法的不足,综合利用权值、相似度和局部密度等概念对单窗口检测出的潜在异常点进行归属查找和异常合并,设计了一种基于多窗口机制的数据流异常检测算法。该算法首先在单个窗口内用改进的K-means聚类算法对预处理之后的数据流进行初步聚类检测,将每个窗口聚类的结果分为正常簇集合和潜在异常点集合。然后对单窗口检测结果进行二次判断。针对单窗口检测的潜在异常点,利用相似度原理进行正常类簇的归属查找,排除异常误判;利用局部密度等概念,对剩下的潜在异常点进行异常合并,再次排除可能的正常点。最后利用时间权值,综合多个数据流窗口的检测结果得出最终异常数据。仿真实验表明,相较于单窗口数据流异常检测算法,该算法提高了数据流的异常检测率,减少了异常误判,在检测率和误报率方面更具优势。
[Abstract]:In this paper, by analyzing the deficiency of single window clustering anomaly detection algorithm, using the concepts of weight, similarity and local density, we can find and merge the potential outliers detected by single window. An algorithm of data stream anomaly detection based on multi-window mechanism is designed. Firstly, the improved K-means clustering algorithm is used to detect the pre-processed data stream in a single window, and the results of each window clustering are divided into normal cluster set and potential outlier point set. Then the results of single window detection are judged twice. For the potential outliers detected by single window, the homing search of normal clusters is carried out by the similarity principle, and the abnormal misjudgment is eliminated. By using the concepts of local density, the remaining potential outliers are merged and the possible normal points are eliminated again. Finally, using the time weight value, the detection results of multiple data stream windows are synthesized to obtain the final abnormal data. The simulation results show that compared with the single window data flow anomaly detection algorithm, the algorithm improves the anomaly detection rate of the data flow, reduces the abnormal error detection, and has more advantages in the detection rate and false alarm rate.
【作者单位】: 海军工程大学信息安全系;91428部队;
【基金】:湖北省自然科学基金[2015CF867]
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 侯太平,顾大权,王柏春,朱红伟;远程天气会商系统中的数据流处理[J];计算机工程;2003年03期
2 陈昕,宋瀚涛;基于数据流的近似查询计算及其应用研究[J];计算机应用研究;2003年11期
3 陈昕,陈维兴,苏锦祥;基于数据流模式的聚集快速查询计算研究[J];计算机集成制造系统;2004年06期
4 张冬冬,李建中,王伟平,郭龙江;分布式复式数据流的处理[J];计算机研究与发展;2004年10期
5 王金栋;周良;张磊;丁秋林;;一类数据流连续查询的降载策略研究[J];武汉大学学报(工学版);2005年06期
6 刘景春;;数据流分类关键技术研究[J];佳木斯大学学报(自然科学版);2007年01期
7 李琳;孙士兵;;数据流聚类方法发展研究[J];长沙民政职业技术学院学报;2008年04期
8 陈军;周明天;杨晓燕;;数据流系统降载研究综述[J];计算机应用研究;2008年10期
9 傅鹂;鲁先志;蔡斌;;一种基于数据流驱动的数据流连续查询模型[J];重庆工学院学报(自然科学版);2008年10期
10 David P.Misunas ,张启瑞;数据流处理机的性能分析[J];计算机工程与应用;1980年12期
相关会议论文 前10条
1 张冬冬;李建中;王伟平;郭龙江;;分布式复式数据流的处理[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 尹婷;李红燕;;窗口模型下数据流查询流水化执行的研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 孟军;张航黎;张建英;郭禾;;分布式数据流的渐增式聚集维护算法[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
5 韩近强;杨冬青;唐世渭;;数据流处理中一种自适应的直方图维护算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
6 蔡致远;熊方;钱卫宁;周傲英;;核合并分析及其在数据流密度估计上的应用[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
7 王亦兵;杨树强;王晓伟;;一个面向数据流的多维分析系统的研究与实现[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
8 于亚新;王国仁;陈灿;苏林;朱歆华;赵相国;;基于操作符优先级的两种分布式数据流负载分配算法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
9 周锐;肖川;王国仁;韩东红;霍欢;;数据流滑动窗口连接上的卸载技术的研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 田李;王乐;贾焰;邹鹏;李爱平;;分布式数据流上低通信开销的连续极值查询方法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
相关博士学位论文 前10条
1 张丽;数据流上序敏感查询处理关键技术研究[D];国防科学技术大学;2013年
2 王超;时间序列数据流复杂模式挖掘研究[D];合肥工业大学;2015年
3 李飒;数据流软聚类理论及其在瓦斯灾害预警中的应用[D];辽宁工程技术大学;2014年
4 陈华辉;基于遗忘特性的数据流概要结构及其应用研究[D];复旦大学;2008年
5 孔英会;数据流技术及其在电力信息处理中的应用研究[D];华北电力大学(河北);2009年
6 崇志宏;基于屏蔽/汇总技术的数据流处理算法[D];复旦大学;2006年
7 姚远;海量动态数据流分类方法研究[D];大连理工大学;2013年
8 曹振丽;面向养殖环境监测的数据流处理方法研究[D];中国农业大学;2015年
9 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年
10 袁志坚;数据流突发检测若干关键技术研究[D];国防科学技术大学;2008年
相关硕士学位论文 前10条
1 王川;面向位置服务的物联网数据质量保证方法研究[D];南京理工大学;2015年
2 祝然威;基于时间窗口的数据流频繁项挖掘算法[D];复旦大学;2014年
3 邱孝兵;基于GPU的数据流聚类及相关性分析[D];大连理工大学;2015年
4 张野;数据流查询语言中语法分析器的设计[D];电子科技大学;2015年
5 闫新院;基于概要模型的数据流聚合技术研究[D];西安电子科技大学;2014年
6 王涛;基于Ntrip协议的实时数据流软件的设计与实现[D];西安电子科技大学;2014年
7 陈彬;数据流实时存储关键技术[D];浙江工业大学;2015年
8 王高洋;基于网格和加速粒子群优化的数据流聚类算法研究[D];哈尔滨师范大学;2015年
9 钱海振;大数据流滞后相关性挖掘方法[D];辽宁师范大学;2015年
10 刘祥佳;制造物联海量数据流模式挖掘算法研究[D];广东工业大学;2016年
,本文编号:2062784
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2062784.html