混合状态数据聚类算法研究

发布时间:2024-07-11 02:53
  对于不同状态的数据,进行聚类处理的算法各不相同,在处理静态型数据时,常用的聚类算法有基于划分的方法,基于密度的方法等等。在处理移动型数据时,则根据已有的静态型数据聚类算法,进行扩展并加入时间维度考量,因此有了许多适用移动型数据的聚类算法。本文从数据的不同状态出发,首先从静态型数据进行研究,并提出相应的聚类算法。然后,对于移动型数据与静态型数据同时存在的混合数据进行讨论,并给出相应的聚类算法。在已有的静态型数据聚类算法中,基于密度的密度峰值算法,是目前较为有影响力的算法,其特点在于对聚类中心的描述上,基于该描述,密度峰值算法逻辑清晰,性能不受空间维度的影响,但也有弊端,算法中的截断距离需要人为指定,算法时间复杂度过高,不能处理流形数据等复杂类型数据。本文受其启发,针对上述问题,首先计算各个数据点的密度,并根据数据点的平均密度,将数据点一分为二。然后在聚类中心的选择上,将高密度数据点作为聚类中心的候选点,并提出了FilterC算法进行筛选出聚类中心。其次,将低于平均密度的数据点作为离群点的候选点,结合近邻优化相关理论,提出了 outlierO算法筛选出离群点。最后,提出IDPC算法,结合v...

【文章页数】:57 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究的目的及意义
    1.2 国内外研究现状
    1.3 课题的来源及其研究内容
        1.3.1 课题的来源
        1.3.2 课题研究内容
第2章 聚类分析算法概述
    2.1 聚类分析基本概念介绍
    2.2 静态型聚类算法介绍
        2.2.1 基于划分的聚类
        2.2.2 基于层次的聚类
    2.3 移动型聚类算法
    2.4 混合聚类算法
    2.5 本章小结
第3章 基于密度峰值和近邻的静态型数据聚类算法
    3.1 密度峰值算法
    3.2 IDPC(Improved Density Peak Cluster)算法
        3.2.1 聚类中心的选取
        3.2.2 离群点的分析和筛选
        3.2.3 数据点分配与合并
    3.3 算法实验分析
    3.4 本章小结
第4章 移动型数据与静态型数据的混合聚类算法
    4.1 相关知识与定义介绍
    4.2 混合状态数据集的聚类算法
        4.2.1 单个移动型数据与静态数据集的聚类算法
        4.2.2 移动型数据集与静态型数据集的聚类算法
    4.3 算法实验分析
    4.4 本章小结
结论
参考文献



本文编号:4005139

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4005139.html

上一篇:LoRaWAN分布式队列设计与系统性能研究  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a5caf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com