当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的聚类个数确定及聚类方法的研究

发布时间:2021-08-04 18:01
  聚类是机器学习中最重要的研究问题之一,关于聚类的工作一直层出不穷。大部分传统聚类算法都是直接作用于原始输入空间,而当原始输入数据属于高维空间时,它们的性能都会受到严重的负面影响。最近提出的深度聚类方法提出利用深度神经网络对原始输入数据进行特征提取,再在特征空间进行聚类任务。尽管在不同的数据集中都能取得令人满意的结果,现有的深度聚类方法都有一个共同缺陷,它们都要求提前获知数据集的聚类个数。然而,在现实应用中,聚类个数通常是未知的。为了解决这个问题,我们对现有的深度聚类算法进行了深入的分析,尝试去找到它们问题的本质。论文具体工作可概括为以下两个方面:(1)提出了深度嵌入确定聚类个数法(DED)。这是一个能够同时确定数据集聚类个数和特征学习的方法。DED方法由一个特征提取器和一个基于密度的聚类个数确定方法组成,它的特征提取器充分结合了卷积自编码器和t-SNE方法的优点,在降低原始输入数据维度的同时,能够很好地保存原始输入数据的数据结构信息和点对相似度信息,所以其特征提取器能够从原始输入数据中提取有效的低维特征用于聚类个数确定。在提取了有效低维特征后,DED方法通过一个基于密度的聚类个数判定方... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于深度学习的聚类个数确定及聚类方法的研究


“轴”方法示意图

结构图,概要,编码器,结构图


国防科技大学研究生院硕士学位论文图2.1自编码器模型的概要结构图图2.2一个有着三个全连接隐层的自编码器的结构图2.2.2卷积神经网络卷积神经网络是一类多层前馈神经网络,最早由Lecun在MNIST数据集上的识别问题中提出并利用,其特别擅长处理图片相关的问题。卷积神经网络主要由卷积层、池化层和全连接层组成,其与普通神经网络最大的不同在于卷积层和池化层。卷积层的涉及是基于局部感知野,将全连接变成了部分连接,其中部分连接通过卷积核实现,一个卷积核在特征层上不断地移动并于部分特征依次相乘,得到下一个特征层的特征,卷积核亦可以被看作滤波器,检测出底层输入的局部特征。例如,第一层或者第二层的卷积层可能检测出图片中的一些低级特征,如“角”、“曲线”和“线段”等,高层的卷积层可能检测出由这些低级特征组成的高级语义信息,如“猫”和“狗”之类的。具体的卷积操作示例可见图2.3,给定一个4*4的图片特征和一个2*2的卷积核,输出如图。卷积神经网络中的另一个重要操作是在池化层,池化本质上是一种降采样。存在多种形式的池化函数,其中“最大池化”是最常用的。具体来说,“最大池化”是将输入的特征矩阵划分为不同的区域,取每个区域的最大值作为输出,这种操作的直觉在于,局域特征之间的相对位置关系远比区域特征的具体位置重要。如图2.4所示,给定一个4*4的第12页

结构图,全连接,编码器,结构图


国防科技大学研究生院硕士学位论文图2.1自编码器模型的概要结构图图2.2一个有着三个全连接隐层的自编码器的结构图2.2.2卷积神经网络卷积神经网络是一类多层前馈神经网络,最早由Lecun在MNIST数据集上的识别问题中提出并利用,其特别擅长处理图片相关的问题。卷积神经网络主要由卷积层、池化层和全连接层组成,其与普通神经网络最大的不同在于卷积层和池化层。卷积层的涉及是基于局部感知野,将全连接变成了部分连接,其中部分连接通过卷积核实现,一个卷积核在特征层上不断地移动并于部分特征依次相乘,得到下一个特征层的特征,卷积核亦可以被看作滤波器,检测出底层输入的局部特征。例如,第一层或者第二层的卷积层可能检测出图片中的一些低级特征,如“角”、“曲线”和“线段”等,高层的卷积层可能检测出由这些低级特征组成的高级语义信息,如“猫”和“狗”之类的。具体的卷积操作示例可见图2.3,给定一个4*4的图片特征和一个2*2的卷积核,输出如图。卷积神经网络中的另一个重要操作是在池化层,池化本质上是一种降采样。存在多种形式的池化函数,其中“最大池化”是最常用的。具体来说,“最大池化”是将输入的特征矩阵划分为不同的区域,取每个区域的最大值作为输出,这种操作的直觉在于,局域特征之间的相对位置关系远比区域特征的具体位置重要。如图2.4所示,给定一个4*4的第12页

【参考文献】:
期刊论文
[1]自适应仿射传播聚类[J]. 王开军,张军英,李丹,张新娜,郭涛.  自动化学报. 2007(12)



本文编号:3322151

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3322151.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f2658***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com