基于超限学习机的聚类算法研究
发布时间:2017-10-13 07:06
本文关键词:基于超限学习机的聚类算法研究
【摘要】:聚类技术作为数据分析中的重要手段,在信息爆炸的现代生活中变得越来越重要。为了获得符合常识的信息,人们对数据进行总结和归纳,利用自身的经验将数据聚类为知识。如今,在各个领域都产生了大量且复杂的数据,对一些领域的信号进行分析的复杂度远远超出了人的分析能力,这就使利用机器代替人工分析数据成为亟待解决的问题,也是人类智慧向人工智慧的跨越。人工神经网络是以大脑神经元为原型的数据分析算法,其与聚类技术的结合将使聚类技术更加符合数据内在的规律,进一步提高聚类算法的性能。为了探索人工神经网络与聚类技术相结合的方式,本文进行了如下研究工作:首先,本文回顾了聚类技术的发展历程,在分析聚类算法所涉及相关技术的同时,寻找人工神经网络与聚类技术相结合的切入点。通过总结各种聚类算法及人工神经网络的联系与区别,本文发现超限学习机模型拥有能够契合迭代式聚类算法的特点,并尝试将其与经典的迭代式聚类算法——K均值算法相结合。其次,为了研究超限学习机模型与K均值算法的结合方式,提出了一种基于K均值算法迭代聚类框架的模块化描述。通过划分和拓展K均值算法的步骤,归纳出包括特征空间映射、初始化聚类中心、相似性函数、聚类中心更新以及判断终止条件这五个关键模块,并阐述了实现各个模块的技术方案。接着,本文具体描述了超限学习机模型与K均值算法的结合方案,提出基于超限学习机的聚类算法(K-Extreme Learning Machines Clustering,KELMC)。为了使得该方法能够适应不同的数据环境,本文依据前面提及的各模块实现方案,提出了两种针对KELMC算法的优化策略,即基于ELM-AE与PCA特征空间的KELMC算法和半监督流形学习的KELMC算法。最后,本文分别在人工数据集和UCI数据集上对所提出的三种方法进行了聚类性能的分析与验证,并在实验过程中讨论了所提出方法的参数选择问题。实验结果显示,本文提出的KELMC算法将超限学习机模型与聚类技术进行了有效结合,并在多数数据集上获得了较好的聚类效果,具有较强的适应与泛化能力。
【关键词】:聚类 K均值算法 人工神经网络 超限学习机
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-8
- 第1章 绪论8-14
- 1.1 研究背景及意义8-9
- 1.2 研究历史及现状9-12
- 1.2.1 聚类算法相关技术现状9-10
- 1.2.2 人工神经网络相关技术现状10-12
- 1.3 课题来源12-13
- 1.4 本文研究内容及结构13-14
- 第2章 背景技术介绍14-22
- 2.1 K均值算法14-16
- 2.2 超限学习机模型16-18
- 2.3 超限学习机自编码器18-20
- 2.4 本章小结20-22
- 第3章 基于超限学习机的聚类算法22-42
- 3.1 K均值算法的模块化描述22-25
- 3.1.1 特征空间映射23-24
- 3.1.2 聚类中心初始化24-25
- 3.1.3 相似性函数25
- 3.1.4 聚类中心更新25
- 3.1.5 终止条件判断25
- 3.2 基于超限学习机的聚类算法25-31
- 3.2.1 模型参数初始化27
- 3.2.2 模型训练集的构成27-28
- 3.2.3 超限学习机模型的训练28
- 3.2.4 终止条件判断28-29
- 3.2.5 聚类中心更新29
- 3.2.6 KELMC算法描述29-31
- 3.3 基于ELM-AE与PCA特征空间的KELMC算法31-35
- 3.3.1 基于ELM-AE的特征映射32
- 3.3.2 基于PCA的特征降维32-33
- 3.3.3 EP-KELMC算法描述33-35
- 3.4 基于半监督流形学习的KELMC算法35-40
- 3.4.1 流形结构信息获取36-37
- 3.4.2 半监督超限学习机模型的训练37-38
- 3.4.3 聚类中心更新38
- 3.4.4 MF-KELMC算法描述38-40
- 3.5 本章小结40-42
- 第4章 实验分析及参数讨论42-56
- 4.1 实验描述42-45
- 4.1.1 聚类算法的评价指标42
- 4.1.2 人工数据集描述42-43
- 4.1.3 UCI数据集描述43-45
- 4.2 参数选择45-50
- 4.2.1 正则项系数45-47
- 4.2.2 隐层节点个数47-49
- 4.2.3 中心样本个数49-50
- 4.3 实验的结果及分析50-54
- 4.3.1 在人工数据集上的实验结果分析50-53
- 4.3.2 在UCI数据集上的实验结果分析53-54
- 4.4 本章小结54-56
- 结论56-58
- 参考文献58-62
- 攻读硕士学位期间的研究成果62-64
- 致谢64
本文编号:1023463
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1023463.html