基于最近邻思想的Chameleon聚类算法研究
发布时间:2021-09-03 09:09
近年来,随着科学技术的进步,数据收集与数据存储的能力也得到了进一步的发展,从而使人们可以获取海量数据,如何从海量的数据中寻找有用的信息已经成为一个迫切需要解决的问题,数据挖掘技术的产生为人们解决这一问题提供了方法。数据挖掘技术将各种数据分析方法与处理海量数据的算法结合,为探究新的数据类型和使用新方法处理旧数据类型提供了新的解决思路。数据挖掘技术的任务可以分为四种,其中聚类分析方法是数据挖掘技术中应用最为广泛的一个分支,在应用统计学、信息检索、生物研究以及商业等方面都有应用。Chamelcon聚类算法是一种凝聚的层次聚类算法,它使用有效的图分区算法将数据的初始分区与一种层次聚类方案相结合,利用一种新颖的相似性度量函数将图的子类组合在一起以获得最终的聚类结果。Chameleon算法可以适用于不同形状、密度和大小的数据集,但它仍存在一定的局限:Chameleon聚类算法在多个关键阶段需要确定参数,聚类结果对参数较敏感;算法中使用距离度量相似性对于高维数据而言不太适用,导致最终聚类结果较差。本文主要对Chameleon聚类算法进行了相关研究,具体研究内容和研究结果如下:1.提出了基于自然邻居的...
【文章来源】:西安理工大学陕西省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
聚类分析算法的分类Fig.2-1Classificationofclusteranalysisalgorithma.分层聚类
预备知识9的两个元素,因此单链接也称为最小距离法。在此聚类过程中,两个簇之间的距离由这两个簇各自的数据对象决定,如果数据对象具有相似性,则两个簇之间的相似性等于从一个簇中的任何成员到另一个簇中的任何成员的最大相似性,即最短距离。单链接技术适合处理非椭圆形状的簇,缺点在于对异常点敏感。单链接技术中,两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(min),(CbCb(2-2)图2-2单链接示意图Fig.2-2Singlelinkschematic(2)完全链接技术[38]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的最长距离确定。使用图的术语,若我们将所有点作为单点簇开始,每次在点之间加上一条链,最短的链先加,则一组点直到其中所有的点都完全被链接,即形成团,从而形成一个簇。完全链接对噪声和离群点不太敏感,但是可能会使大的簇破裂,并且偏好球形数据集。完全链接两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(max),(CbCb(2-3)图2-3全链接示意图Fig.2-3Fulllinkschematic(3)平均链接技术[39]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的平均距离确定。这是一种介于单链和全链之间的折中方法。平均链接两组簇iC和jC之间的邻近度定义如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分别代表簇iC和jC的所含数据点的个数。
预备知识9的两个元素,因此单链接也称为最小距离法。在此聚类过程中,两个簇之间的距离由这两个簇各自的数据对象决定,如果数据对象具有相似性,则两个簇之间的相似性等于从一个簇中的任何成员到另一个簇中的任何成员的最大相似性,即最短距离。单链接技术适合处理非椭圆形状的簇,缺点在于对异常点敏感。单链接技术中,两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(min),(CbCb(2-2)图2-2单链接示意图Fig.2-2Singlelinkschematic(2)完全链接技术[38]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的最长距离确定。使用图的术语,若我们将所有点作为单点簇开始,每次在点之间加上一条链,最短的链先加,则一组点直到其中所有的点都完全被链接,即形成团,从而形成一个簇。完全链接对噪声和离群点不太敏感,但是可能会使大的簇破裂,并且偏好球形数据集。完全链接两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(max),(CbCb(2-3)图2-3全链接示意图Fig.2-3Fulllinkschematic(3)平均链接技术[39]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的平均距离确定。这是一种介于单链和全链之间的折中方法。平均链接两组簇iC和jC之间的邻近度定义如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分别代表簇iC和jC的所含数据点的个数。
【参考文献】:
期刊论文
[1]基于共享自然近邻的自适应谱聚类算法[J]. 史佳昕,朱庆生. 现代计算机(专业版). 2019(11)
[2]一种基于共享近邻的密度峰值聚类算法[J]. 刘奕志,程汝峰,梁永全. 计算机科学. 2018(02)
[3]基于DPC算法与模块密度的改进Chameleon算法[J]. 宫峰勋,邢晨,马艳秋. 中国民航大学学报. 2017(06)
[4]基于MCL与Chameleon的混合聚类算法[J]. 杨连群,刘树发,温晋英,刘功申. 电子设计工程. 2017(06)
[5]一种改进CHAMELEON算法的聚类算法COCK[J]. 朱烨行,李艳玲,杨献文. 微电子学与计算机. 2015(12)
[6]引入共享近邻加权图的Chameleon算法[J]. 薛文娟,刘培玉,刘栋. 计算机应用. 2012(10)
[7]一种改进的Chameleon聚类算法[J]. 曹长虎,李亚非. 科学技术与工程. 2010(33)
[8]一种基于动态近邻选择模型的Chameleon算法[J]. 赵学锋,杨海斌,王秀花. 西北师范大学学报(自然科学版). 2010(06)
[9]密度敏感的多智能体进化聚类算法[J]. 潘晓英,刘芳,焦李成. 软件学报. 2010(10)
[10]Chameleon算法的改进[J]. 蒋盛益,庞观松,张黎莎. 小型微型计算机系统. 2010(08)
硕士论文
[1]结合AP算法的Chameleon聚类算法研究[D]. 吴雲玲.东北师范大学 2014
本文编号:3380833
【文章来源】:西安理工大学陕西省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
聚类分析算法的分类Fig.2-1Classificationofclusteranalysisalgorithma.分层聚类
预备知识9的两个元素,因此单链接也称为最小距离法。在此聚类过程中,两个簇之间的距离由这两个簇各自的数据对象决定,如果数据对象具有相似性,则两个簇之间的相似性等于从一个簇中的任何成员到另一个簇中的任何成员的最大相似性,即最短距离。单链接技术适合处理非椭圆形状的簇,缺点在于对异常点敏感。单链接技术中,两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(min),(CbCb(2-2)图2-2单链接示意图Fig.2-2Singlelinkschematic(2)完全链接技术[38]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的最长距离确定。使用图的术语,若我们将所有点作为单点簇开始,每次在点之间加上一条链,最短的链先加,则一组点直到其中所有的点都完全被链接,即形成团,从而形成一个簇。完全链接对噪声和离群点不太敏感,但是可能会使大的簇破裂,并且偏好球形数据集。完全链接两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(max),(CbCb(2-3)图2-3全链接示意图Fig.2-3Fulllinkschematic(3)平均链接技术[39]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的平均距离确定。这是一种介于单链和全链之间的折中方法。平均链接两组簇iC和jC之间的邻近度定义如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分别代表簇iC和jC的所含数据点的个数。
预备知识9的两个元素,因此单链接也称为最小距离法。在此聚类过程中,两个簇之间的距离由这两个簇各自的数据对象决定,如果数据对象具有相似性,则两个簇之间的相似性等于从一个簇中的任何成员到另一个簇中的任何成员的最大相似性,即最短距离。单链接技术适合处理非椭圆形状的簇,缺点在于对异常点敏感。单链接技术中,两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(min),(CbCb(2-2)图2-2单链接示意图Fig.2-2Singlelinkschematic(2)完全链接技术[38]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的最长距离确定。使用图的术语,若我们将所有点作为单点簇开始,每次在点之间加上一条链,最短的链先加,则一组点直到其中所有的点都完全被链接,即形成团,从而形成一个簇。完全链接对噪声和离群点不太敏感,但是可能会使大的簇破裂,并且偏好球形数据集。完全链接两组簇iC和jC之间的邻近度定义如下:jijiCadCpa,:),(max),(CbCb(2-3)图2-3全链接示意图Fig.2-3Fulllinkschematic(3)平均链接技术[39]两个簇之间的距离由一个簇的任何成员到另一簇的任何成员的平均距离确定。这是一种介于单链和全链之间的折中方法。平均链接两组簇iC和jC之间的邻近度定义如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分别代表簇iC和jC的所含数据点的个数。
【参考文献】:
期刊论文
[1]基于共享自然近邻的自适应谱聚类算法[J]. 史佳昕,朱庆生. 现代计算机(专业版). 2019(11)
[2]一种基于共享近邻的密度峰值聚类算法[J]. 刘奕志,程汝峰,梁永全. 计算机科学. 2018(02)
[3]基于DPC算法与模块密度的改进Chameleon算法[J]. 宫峰勋,邢晨,马艳秋. 中国民航大学学报. 2017(06)
[4]基于MCL与Chameleon的混合聚类算法[J]. 杨连群,刘树发,温晋英,刘功申. 电子设计工程. 2017(06)
[5]一种改进CHAMELEON算法的聚类算法COCK[J]. 朱烨行,李艳玲,杨献文. 微电子学与计算机. 2015(12)
[6]引入共享近邻加权图的Chameleon算法[J]. 薛文娟,刘培玉,刘栋. 计算机应用. 2012(10)
[7]一种改进的Chameleon聚类算法[J]. 曹长虎,李亚非. 科学技术与工程. 2010(33)
[8]一种基于动态近邻选择模型的Chameleon算法[J]. 赵学锋,杨海斌,王秀花. 西北师范大学学报(自然科学版). 2010(06)
[9]密度敏感的多智能体进化聚类算法[J]. 潘晓英,刘芳,焦李成. 软件学报. 2010(10)
[10]Chameleon算法的改进[J]. 蒋盛益,庞观松,张黎莎. 小型微型计算机系统. 2010(08)
硕士论文
[1]结合AP算法的Chameleon聚类算法研究[D]. 吴雲玲.东北师范大学 2014
本文编号:3380833
本文链接:https://www.wllwen.com/wenyilunwen/sixiangpinglunlunwen/3380833.html