基于ρ-δ决策图的模糊C均值聚类方法研究

发布时间:2024-05-28 03:21
  模糊聚类是对没有标签的数据集进行有效划分的重要手段之一。随着大数据时代的到来,数据量呈指数增长,然而大多数数据是没有标签的,如何将这些数据准确分类,并为用户提供更准确的服务成了当今社会重点研究的方向。模糊C均值算法(FCM)是一种基于目标函数的模糊聚类算法,与典型的“硬聚类”算法(如k-means算法)相比较。FCM算法计算每个样本对所有类的隶属度,得到更可靠、准确的分类结果。然而,在聚类过程中,FCM算法需要人工确定聚类数目,并且对初始聚类中心敏感。容易产生多聚类迭代、收敛速度慢、局部最优解等问题。为了解决这些问题,本文提出将FCM算法与决策图相结合的算法(DGFCM)。首先利用决策图自动选择聚类中心和聚类数目,然后利用FCM算法实现聚类。本文首先综述了国内外关于改进FCM算法的研究方法,根据目标准则函数阐述了5个方向的FCM算法的改进;其次,通过实验证明了初始聚类中心对FCM迭代次数和聚类结果存在较大影响;再详细介绍了基于ρ-δ决策图的模糊C均值聚类方法;最后,分别采用UCI真实数据集和人工数据集作为实验样本数据,运用传统FCM聚类算法、快速密度峰聚类算法(DPC)、DGFCM算法...

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究的背景和意义
        1.1.1 研究背景
        1.1.2 选题的意义
    1.2 国内外研究现状
        1.2.1 距离度量方法与非平衡数据聚类研究
        1.2.2 目标准则函数与隶属度约束条件研究
        1.2.3 初始聚类中心选择方法研究
    1.3 论文研究思路及内容
第2章 聚类方法概述
    2.1 聚类及其应用领域
    2.2 常用聚类方法
        2.2.1 基于划分的聚类方法
        2.2.2 基于层次的聚类方法
        2.2.3 基于密度的聚类方法
        2.2.4 基于模型的聚类方法
        2.2.5 模糊聚类方法
    2.3 FCM初始聚类中心选择方法
        2.3.1 随机选择方法
        2.3.2 遗传算法
        2.3.3 蚁群算法
    2.4 聚类效果评价
        2.4.1 AMI指标
        2.4.2 ARI指标
        2.4.3 F-measure指标
第3章 FCM初始聚类中心选择算法设计
    3.1 模糊C均值聚类
        3.1.1 FCM基本思想
        3.1.2 算法描述
    3.2 FCM初始聚类中心敏感性分析
        3.2.1 数据准备
        3.2.2 聚类效果检验
    3.3 ρ-δ决策图
        3.3.1 局部密度定义
        3.3.2 相对距离定义
        3.3.3 聚类中心自动选择方法
    3.4 DGFCM算法设计
        3.4.1 设计思路
        3.4.2 算法步骤
        3.4.3 算法性能分析
第4章 DGFCM算法实验分析
    4.1 实验数据
    4.2 DGFCM与 FCM比较
        4.2.1 人工数据集实验
        4.2.2 UCI数据集实验
    4.3 DGFCM与 DPC比较
        4.3.1 人工数据集实验
        4.3.2 UCI数据集实验
第5章 结论与展望
    5.1 研究结论
    5.2 研究展望
致谢
参考文献
附录1 攻读硕士学位期间发表的论文
附录2 数据



本文编号:3983420

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3983420.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0a7f4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com