当前位置:主页 > 科技论文 > 软件论文 >

基于DBSCAN算法的异常检测方法研究

发布时间:2021-01-25 17:54
  异常检测是数据挖掘领域常用的一种手段,其中基于聚类的异常检测技术最为流行。目前已经提出了多种聚类算法,主要分为划分、层次和基于密度的聚类算法。基于密度的聚类能处理任意形状的簇结构,并且易于实现,因此该算法变得非常流行,其中DBSCAN算法最具代表性。由于其在识别噪声数据方面的性能,因此也常被用于异常数据的检测。但在实际应用中,DBSCAN算法时间复杂度较高,执行效率较低,不利于处理海量数据集;且对输入全局参数敏感,不利于处理非均匀数据集。本文从以上问题出发,提出了解决方法,主要工作包括以下几个方面:首先,为了降低算法的运行时间,结合MCMC(Markov Chain Monte Carlo,马尔可夫链蒙特卡洛)采样方法对DBSCAN(Density-based spatial clustering of applications with noise,简称DBSCAN)进行改进,提出了一种新的聚类算法,称为DBSCAN++。其基本思想是优先扩展拓展能力较强的核心对象。理论分析和模拟实验表明DBSCAN++相对于DBSCAN聚类准确性相当,而DBSCAN++具有更低的运行时间。因此,DB... 

【文章来源】:中国民航大学天津市

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

基于DBSCAN算法的异常检测方法研究


对象p的邻域

对象,密度,密度相,中国民航


中国民航大学硕士学位论文对象。 密度可达:对于对象 p 和对象 q,若存在一系列的对象 p1=q,p对于 pi是密度可达的,则认为 p 相对于 q 是密度可达的,此时 称为 p 的密度可达对象。如图 2-2 所示。

过程图,扩展操作,核心对象,邻域


7图 2-3 密度相连对象扩展操作:对核心对象 p 进行扩展操作即为确定其邻域 N 2-2 可以看出,对象扩展操作即遍历核心对象 p 邻域内所有的边界点:在半径ε内部的对象数量小于 MinPts,但是仍属于核其实并不是核心对象,只不过与其他核心对象的距离小于 Min

【参考文献】:
期刊论文
[1]基于核密度估计的K-CFSFDP聚类算法[J]. 董晓君,程春玲.  计算机科学. 2018(11)
[2]面向时序数据异常检测的可视分析综述[J]. 韩东明,郭方舟,潘嘉铖,郑文庭,陈为.  计算机研究与发展. 2018(09)
[3]Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法[J]. 冯振华,钱雪忠,赵娜娜.  计算机应用研究. 2016(09)
[4]DBSCAN算法中参数的自适应确定[J]. 李宗林,罗可.  计算机工程与应用. 2016(03)
[5]回溯式在线EASI盲源分离算法[J]. 陈海平,张杭,张江.  信号处理. 2013(09)
[6]基于限定区域数据取样的密度聚类算法[J]. 周红芳,赵雪涵,周扬.  计算机应用. 2012(08)
[7]SA-DBSCAN:一种自适应基于密度聚类算法[J]. 夏鲁宁,荆继武.  中国科学院研究生院学报. 2009(04)
[8]一种基于参考点和密度的快速聚类算法[J]. 马帅,王腾蛟,唐世渭,杨冬青,高军.  软件学报. 2003(06)
[9]一种基于密度的快速聚类算法[J]. 周水庚,周傲英,曹晶,胡运发.  计算机研究与发展. 2000(11)

硕士论文
[1]基于贝叶斯MCMC算法的股指VaR实证研究[D]. 李睿.哈尔滨工业大学 2018
[2]基于DBSCAN的自适应非均匀密度聚类算法研究[D]. 王实美.北京交通大学 2017
[3]基于层次聚类的数据分析[D]. 缪元武.安徽大学 2013
[4]数据挖掘算法及其应用研究[D]. 黄雯.南京邮电大学 2013



本文编号:2999635

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2999635.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户199e6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com