一种基于k-均值的DBSCAN算法参数动态选择方法
本文选题:聚类 切入点:一种经典的基于密度的聚类算法(DBSCAN) 出处:《计算机工程与应用》2017年03期
【摘要】:为解决DBSCAN聚类算法的Eps及MinPts参数选择问题,提出一种领域无关的参数动态选择方法。首先,基于k-均值算法对数据集进行初步聚类,聚类中采用最大最小距离方法确定初始聚类中心。其次,针对k-均值聚类结果,计算统计各聚类中样本间距离的分布情况,选择使得具有最大样本对数的距离值作为对应类的Eps值,并通过Eps获得MinPts值。最后,对DBSCAN算法进行改进,使其可根据当前核心点所属k-均值聚类对应的Eps对其运行值进行自适应调整。将上述思想运用于未知协议条件下的比特流聚类分析,结果表明,在无需用户指定Eps及MinPts的条件下,即可获得满意的聚类结果,提高了算法的适用性和准确率。
[Abstract]:In order to solve the problem of Eps and MinPts parameter selection in DBSCAN clustering algorithm, a domain independent dynamic parameter selection method is proposed.Firstly, the data set is preliminarily clustered based on the k-means algorithm. The maximum and minimum distance method is used to determine the initial clustering center in the clustering.Secondly, for the K-means clustering results, the distribution of the distance between the samples in each cluster is calculated and the distance value with the maximum sample logarithm is selected as the Eps value of the corresponding class, and the MinPts value is obtained by Eps.Finally, the DBSCAN algorithm is improved so that it can adjust its running value adaptively according to the Eps corresponding to the current kernel point k-means clustering.The above idea is applied to the bitstream clustering analysis under unknown protocol conditions. The results show that the satisfactory clustering results can be obtained without the user specifying Eps and MinPts, and the applicability and accuracy of the algorithm are improved.
【作者单位】: 军械工程学院电子与光学工程系;
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 ;Scaling up the DBSCAN Algorithm for Clustering Large Spatial Databases Based on Sampling Technique[J];Wuhan University Journal of Natural Sciences;2001年Z1期
2 岳士弘,李平,郭继东,周水庚;Using Greedy algorithm: DBSCAN revisited II[J];Journal of Zhejiang University Science;2004年11期
3 蔡颖琨,谢昆青,马修军;屏蔽了输入参数敏感性的DBSCAN改进算法[J];北京大学学报(自然科学版);2004年03期
4 宋明,刘宗田;基于数据交叠分区的并行DBSCAN算法[J];计算机应用研究;2004年07期
5 熊忠阳,孙思,张玉芳,王秀琼;一种基于划分的不同参数值的DBSCAN算法[J];计算机工程与设计;2005年09期
6 何中胜;刘宗田;庄燕滨;;基于数据分区的并行DBSCAN算法[J];小型微型计算机系统;2006年01期
7 李杰;贾瑞玉;张璐璐;;一个改进的基于DBSCAN的空间聚类算法研究[J];计算机技术与发展;2007年01期
8 冯少荣;肖文俊;;基于密度的DBSCAN聚类算法的研究及应用[J];计算机工程与应用;2007年20期
9 谭颖;胡瑞飞;殷国富;;多密度阈值的DBSCAN改进算法[J];计算机应用;2008年03期
10 冯少荣;肖文俊;;一种提高DBSCAN聚类算法质量的新方法[J];西安电子科技大学学报;2008年03期
相关会议论文 前8条
1 马帅;宋国杰;唐世渭;杨冬青;王腾蛟;;基于单元划分的DBSCAN聚类算法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 朵春红;王翠茹;;基于取样的DBSCAN聚类算法及其遗传优化[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
3 庞洋;李海林;郭义喜;;基于DBSCAN算法的日志信息聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 宫蕊;舒红平;郭远远;;基于DBSCAN的密度聚类算法的研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
5 张健沛;许慧;杨静;崔洪晶;;基于数据分区、QR~*-树的并行DBSCAN算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
6 Yi-Chun Xu;Man Zhu;Zunhai Ke;Yong Liu;Suifa Sun;;Isolating Ships from Shape Curve with DBSCAN[A];第25届中国控制与决策会议论文集[C];2013年
7 范晔;周水庚;曹晶;周傲英;;通过数据取样扩展基于密度的聚类算法[A];第十六届全国数据库学术会议论文集[C];1999年
8 曹晶;周水庚;范晔;周傲英;;数据分区:一种改善基于密度的聚类算法的方法[A];第十六届全国数据库学术会议论文集[C];1999年
相关硕士学位论文 前10条
1 陆颖华;基于局部敏感哈希的DBSCAN算法研究[D];南京信息工程大学;2015年
2 汪洋;采用DBSCAN聚类的自适应步长细菌觅食算法[D];南京师范大学;2015年
3 谢江;针对非均匀密度环境的DBSCAN自适应聚类算法的研究[D];重庆大学;2015年
4 崔熠明;基于激光雷达的智能车防撞预警系统研究[D];吉林大学;2016年
5 邵梦汝;基于铁路客票信息的旅客购票行为分析[D];西南交通大学;2016年
6 韩梅;基于改进DBSCAN的复杂工业过程建模数据异常点检测研究[D];天津工业大学;2016年
7 刘聪;基于SPARK平台的LAMOST早M型光谱聚类的研究[D];山东大学;2016年
8 冯振华;基于DBSCAN聚类算法的研究与应用[D];江南大学;2016年
9 田路强;基于DBSCAN的分布式聚类及增量聚类的研究与应用[D];北京工业大学;2016年
10 罗启福;基于云计算的DBSCAN算法研究[D];武汉理工大学;2013年
,本文编号:1715093
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1715093.html