基于不同类型数据的聚类算法研究
发布时间:2021-02-03 11:01
聚类分析是一种无监督的学习方式,是数据挖掘的重要途径之一,也是统计机器学习、模式识别的重要研究方向之一.目前,针对数值型数据的聚类研究已取得丰硕的成果,而实际应用中,存在大量的分类型或混合型数据.因此,研究不同类型数据下的聚类算法就尤为重要.而聚类过程中通常又面临两大难题:类中心的选择和聚类个数的确定.为了解决这两个问题,本文分别以分类型和混合型数据为例,取得了以下研究成果:(1)针对分类型数据,本文主要研究分类型矩阵对象数据(一个属性上有多个取值的数据),并基于矩阵对象数据提出一种改进的MD fuzzy(?)-modes算法.该算法拓展了简单的“0-1”匹配,重新定义了矩阵对象数据的相异性度量,克服了用传统算法对该类型数据进行聚类会损失信息的不足.在类中心的选择上,结合模糊集概念,提出一种启发式更新算法,大大减少了时间复杂度.最后,在5个UCI数据集上验证了MD fuzzy(?)-modes算法的有效性.(2)针对混合型数据,基于信息熵给出了属性权重的新度量方法,并提出一种加权(?)-prototype算法来确定聚类个数.该算法在考虑属性权重的情况下,重新定义了混合数据缺失某类的类间...
【文章来源】:山西大学山西省
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 分类型数据聚类研究现状
1.2.2 混合型数据聚类研究现状
1.3 本文的主要工作
1.4 本文的组织结构
第二章 聚类的相关理论
2.1 聚类的概念
2.2 聚类分析的基本步骤
2.3 常见的数据类型
2.4 聚类分析的应用领域
2.5 聚类算法的主要类别
2.6 本章小结
第三章 基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法
3.1 引言
3.2 回顾fuzzy(?)-modes算法
3.3 基于矩阵对象数据的MD fuzzy(?)-modes聚类算法
3.3.1 矩阵对象间的相异性度量
3.3.2 启发式更新算法
3.3.3 MD fuzzy(?)-modes聚类算法
3.4 实验结果与分析
3.4.1 评价指标
3.4.2 启发式与全局性更新类中心算法的比较
3.4.3 MD fuzzy(?)-modes算法与其他算法的比较
3.4.4 (?)与(?)的关系
3.5 本章小结
第四章 基于混合型数据的加权k-prototype聚类算法
4.1 引言
4.2 (?)-prototype算法的相关研究
4.3 一种加权的混合数据聚类个数确定算法
4.3.1 混合数据的属性权重
4.3.2 寻找最坏类的广义性机制
4.3.3 混合数据聚类的有效性指标
4.3.4 混合数据相异性度量
4.3.5 加权(?)-prototype聚类算法
4.4 实验结果与分析
4.4.1 评价指标
4.4.2 加权(?)-prototype算法与Liang(?)-prototype算法的比较
4.5 本章小结
总结与展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
本文编号:3016392
【文章来源】:山西大学山西省
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 分类型数据聚类研究现状
1.2.2 混合型数据聚类研究现状
1.3 本文的主要工作
1.4 本文的组织结构
第二章 聚类的相关理论
2.1 聚类的概念
2.2 聚类分析的基本步骤
2.3 常见的数据类型
2.4 聚类分析的应用领域
2.5 聚类算法的主要类别
2.6 本章小结
第三章 基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法
3.1 引言
3.2 回顾fuzzy(?)-modes算法
3.3 基于矩阵对象数据的MD fuzzy(?)-modes聚类算法
3.3.1 矩阵对象间的相异性度量
3.3.2 启发式更新算法
3.3.3 MD fuzzy(?)-modes聚类算法
3.4 实验结果与分析
3.4.1 评价指标
3.4.2 启发式与全局性更新类中心算法的比较
3.4.3 MD fuzzy(?)-modes算法与其他算法的比较
3.4.4 (?)与(?)的关系
3.5 本章小结
第四章 基于混合型数据的加权k-prototype聚类算法
4.1 引言
4.2 (?)-prototype算法的相关研究
4.3 一种加权的混合数据聚类个数确定算法
4.3.1 混合数据的属性权重
4.3.2 寻找最坏类的广义性机制
4.3.3 混合数据聚类的有效性指标
4.3.4 混合数据相异性度量
4.3.5 加权(?)-prototype聚类算法
4.4 实验结果与分析
4.4.1 评价指标
4.4.2 加权(?)-prototype算法与Liang(?)-prototype算法的比较
4.5 本章小结
总结与展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
本文编号:3016392
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3016392.html