基于流型的贝叶斯层次聚类分析
发布时间:2021-09-17 15:29
聚类分析是一类重要的无监督学习算法,其目的是在没有样本标签的情况下将数据总体划分为彼此性质不同的子集。由于没有标签指导训练过程,聚类分析中两个关键的问题是子类个数的选择和类间距离度量标准的选取。当样本的维数很高时,聚类分析还需要对样本进行降维,以达到减少计算量,舍弃无用信息的目的。高维数据的潜在结构虽然是低维的,但往往是非线性的,因此传统的线性降维方法,如主成分分析等在降维时会丢失数据集的内部结构。目前尚没有一种能够对高维数据进行有效聚类分析的算法。为了能对高维图像数据进行有效的降维,同时在聚类时避免主观选择类的个数和样本间的距离度量标准,本文考虑基于流型的贝叶斯层析聚类分析,即首先用适当的流型学习算法对图像数据进行有效的降维,对降维后的数据进行贝叶斯层次聚类分析。本文选用手写数字识别、物体识别和人脸识别共三组实际高维图像数据进行聚类分析,分析结果表明,流型学习能够在降维的同时最大程度的保留图像数据集的内部结构。同时,与传统的聚类算法以及基于线性降维的贝叶斯层次聚类算法相比,基于流型降维的贝叶斯层次聚类法能够以较低的计算量自动的选择出接近真实值的子类个数,同时对数据进行恰当的聚类。
【文章来源】:云南大学云南省 211工程院校
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
每个MNIST样本是2828的灰度图片
线性整体结构有时不利于聚类分析
手写数字‘3’在三维流型中变化
本文编号:3399002
【文章来源】:云南大学云南省 211工程院校
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
每个MNIST样本是2828的灰度图片
线性整体结构有时不利于聚类分析
手写数字‘3’在三维流型中变化
本文编号:3399002
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3399002.html