当前位置:主页 > 科技论文 > 软件论文 >

自适应模糊连接点聚类算法的研究

发布时间:2023-12-24 12:11
  模糊连接点聚类算法(Fuzzy Joint Points,FJP)是近年来出现的一种新型模糊聚类算法,其优点是不需要预先设定聚类个数,能通过数据点的连接关系判断数据点间的类别相似性,具有较好的鲁棒性。但应用中该算法也有若干不足:(1)FJP算法以划分结果中频率最高的聚类簇数为最佳聚类数,这种定夺方式在很多高维数据集并不适用,有一定的随机性,影响算法的准确率。(2)α划分水平衰减的范围过大会导致算法迭代次数多,在大型数据集上计算时间会很长。(3)FJP算法中使用简单的欧氏距离公式计算数据元素间的模糊相似度,这在多维的复杂数据集上存在结果失真的情况。针对上述问题,本文进行以下两点改进:(1)针对原FJP算法最佳聚类数的确定问题,以K插值单纯形法的高斯径向核函数充分挖掘数据元素间的相似关系,并提出Kernels-VCN指标来评估所有划分结果,遵循类内数据尽可能相似和类间数据尽可能不相似的原则,最后以直观的指标值来自动确定最佳划分水平以及最佳聚类数,提高算法的自适应性。(2)针对FJP算法的α划分水平衰减范围过大,造成迭代多的问题,引入2014年《Science》密度峰聚类算法的决策图辅助FJ...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 选题背景和研究意义
    1.2 国内外研究现状
        1.2.1 最佳聚类数和最佳划分水平的研究现状
        1.2.2 计算模糊相似度的研究现状
        1.2.3 划分水平的范围
    1.3 本文研究内容
    1.4 论文结构
第二章 模糊连接点聚类算法简介
    2.1 算法的相关定义
        2.1.1 模糊相似度矩阵
        2.1.2 圆锥形模糊点集
    2.2 FJP算法流程
        2.2.1 FJP-2008算法简介
        2.2.2 FJP2016算法流程图
    2.3 本章小结
第三章 基于有效近邻簇(VCN)的自适应FJP聚类算法
    3.1 确定最佳聚类数的相关指标
        3.1.1 Davies-Bouldin(DB)指标
        3.1.2 In-Group Proportion(IGP)指标
        3.1.3 Wint指标
        3.1.4 Calinski-Harabasz(CH)指标
        3.1.5 VCN指标
    3.2 距离计算函数
    3.3 Kernels-VCN指标
        3.3.1 Kernels-VCN指标的相关概念定义
        3.3.2 Kernels-VCN指标和最佳聚类数的确定
    3.4 基于有效近邻簇(VCN)的自适应FJP聚类算法
    3.5 仿真实验与分析
        3.5.1 实验环境和实验数据集
        3.5.2 聚类结果分析
    3.6 本章小结
第四章 基于决策图的自适应FJP算法
    4.1 MFJP算法中最佳α划分水平的确定问题
    4.2 决策图确定最佳聚类数
        4.2.1 决策图原理和相关定义
        4.2.2 决策图确定聚类中心
    4.3 基于决策图的自适应FJP算法
    4.4 仿真实验与分析
        4.4.1 实验环境和实验数据集
        4.4.2 聚类结果分析
    4.5 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读硕士学位期间发表论文情况



本文编号:3874484

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3874484.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c6912***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com