当前位置:主页 > 科技论文 > 软件论文 >

基于多种层次聚类的算法研究

发布时间:2023-02-26 08:43
  近年来大数据、互联网+以及云时代等概念的提出将数据挖掘技术推向了各行各业,聚类作为数据挖掘的重要方法被广泛应用于各个领域。随着数据规模的增大以及数据类型的多样化、复杂化,传统聚类算法面临着严峻的挑战。目前大多聚类算法都存在对参数依赖性高、计算量大的问题,针对这些问题,提出了一种高效的新型层次聚类算法。其次,现有聚类算法大多采用样本间的距离作为相似性度量,该相似性度量方法存在度量不准确、受噪音点影响大等问题。针对此类问题,提出了一种基于样本分布的相似性度量方法,在该相似性度量的基础上,提出了一种基于密度聚类和层次聚类的混合型聚类算法。本文的主要工作包括以下两部分:1.提出了一种高效的新型层次聚类算法。该算法由分裂和合并两阶段组成,分裂阶段将初始数据集作为一个类,通过多次分裂得到多于实际聚类数目的子类。在合并阶段将分裂过程中多划分的子类合并为正确的类。针对多数层次聚类算法计算量大的缺点,在分裂阶段提出一种根据统计样本分布找到最佳分裂位置的方法,该方法准确、高效并且避免了重复地计算样本相似性矩阵,从而大大减少了计算量。在合并阶段提出了一种带有标记检测的合并策略,该策略通过在分裂阶段中加入分裂...

【文章页数】:77 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 目前面临的挑战
    1.4 主要内容及组织框架
第二章 基础知识介绍
    2.1 聚类分析的基本概念
    2.2 相关度量和评价指标
        2.2.1 样本间相似性度量
        2.2.2 类相似性度量
        2.2.3 聚类评估标准
    2.3 常见聚类算法
        2.3.1 基于层次的聚类算法
        2.3.2 基于划分的聚类算法
        2.3.3 基于密度的聚类算法
        2.3.4 基于网格的聚类算法
        2.3.5 基于模型的聚类算法
    2.4 本章小结
第三章 一种高效的新型层次聚类算法
    3.1 引言
    3.2 相关概念及定义介绍
    3.3 算法分析与实验结果
        3.3.1 算法性能分析
        3.3.2 实验结果分析
    3.4 本章小结
第四章 基于密度和层次的混合型聚类算法
    4.1 引言
    4.2 基于密度和层次的混合型聚类算法
        4.2.1 基于改进快速密度峰算法的数据划分方法
        4.2.2 基于自适应聚合函数的聚合型层次聚类算法
    4.3 实验与结果分析
        4.3.1 算法时间复杂度分析
        4.3.2 实验结果分析
    4.4 本章小结
第五章 总结和展望
    5.1 本文工作总结
    5.2 未来工作展望
参考文献
致谢
作者简介



本文编号:3750215

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3750215.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3571c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com