密度峰值优化初始中心的K-medoids聚类算法
发布时间:2017-07-01 09:06
本文关键词:密度峰值优化初始中心的K-medoids聚类算法,,由笔耕文化传播整理发布。
【摘要】:针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。
【作者单位】: 陕西师范大学计算机科学学院;
【关键词】: 聚类 K-medoids算法 初始聚类中心 密度峰值 准则函数
【基金】:国家自然科学基金No.31372250 陕西省科技攻关项目No.2013K12-03-24 中央高校基本科研业务费专项资金No.GK201503067~~
【分类号】:TP311.13
【正文快照】: K-medoids Clustering Algorithms with Optimized Initial Seeds by Density PeaksXIE Juanying+,QU YananSchool of Computer Science,Shaanxi Normal University,Xi’an 710062,ChinaXIE Juanying,QU Yanan.K-medoids clustering algorithms with optimized initial seeds
【相似文献】
中国期刊全文数据库 前3条
1 马箐;谢娟英;;基于粒计算的K-medoids聚类算法[J];计算机应用;2012年07期
2 王忠强;李贵;韩子扬;郑新录;;基于K-medoids聚类算法的研究与实现[J];硅谷;2011年02期
3 ;[J];;年期
本文关键词:密度峰值优化初始中心的K-medoids聚类算法,由笔耕文化传播整理发布。
本文编号:505291
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/505291.html