基于智能优化算法的聚类分析及应用
发布时间:2017-06-15 21:11
本文关键词:基于智能优化算法的聚类分析及应用,,由笔耕文化传播整理发布。
【摘要】:随着科学技术的进步以及数据库应用的普及,数据挖掘技术已经成为近年来国际社会在信息决策领域的重要研究方向之一,同时,也是随着信息技术不断发展而形成的一门新学科。聚类分析作为一种重要的数据分析方法已经成为数据挖掘领域中一个非常活跃的研究课题。聚类分析的方法有很多,在本文中重点介绍了C-MEANS和模糊C-MEANS(FCM)基于划分的聚类方法。但是对初始聚类中心的选择敏感,并且容易陷入局部最优是这两种聚类算法典型的缺点。因而,在本文引入了智能优化算法。智能优化算法是迅速发展起来的对已有一些经典的聚类算法进行优化的行之有效的方法。近年来,发展起来的用于聚类分析的智能优化的算法主要有:基于免疫原理的人工免疫算法、基于进化的差分进化算法、基于蚂蚁系统的蚁群算法、基于遗传学的遗传算法和模拟退火算法等智能优化计算方法。这些算法各有特点,广泛用于解决各类聚类问题。本论文主要利用了基于免疫原理的人工免疫算法、把遗传算法和模拟退火相融合的算法来实现数据聚类并将聚类方法应用到图像压缩即设计矢量量化码书,通过实验验证均取得了有效的结果,主要工作包括以下三个方面:首先,针对传统的克隆选择算法在解决聚类问题中存在着收敛速度慢、聚类效果不佳以及进化聚类算法采用单一的聚类指标的缺陷等问题。将多目标优化思想引入到免疫克隆聚类算法中,根据免疫系统所体现出的局部学习生物特征,在算法中设计了一种新的局部学习算子,并在此基础上提出了基于局部学习算子的人工免疫多目标模糊聚类算法。提出的算法在对人工数据集和UCI数据集聚类的结果表明,该算法能取得较高的聚类正确率其次,针对遗传算法的容易陷入早熟以及模拟退火算法收敛速度慢等缺点,将模拟退火算法融入到遗传算法中,提出基于遗传的模拟退火聚类算法及其在矢量量化码书设计中的应用。鉴于基于划分的染色体实数编码方式的特点以及对染色体的操作细化为对基因的操作,由此提出了新的有效的模拟退火方法、以及交叉操作算子和突变操作算子。同时,算法中采用核空间距离代替欧氏距离,从而使得提出的聚类算法能处理分布复杂的数据聚类问题。在此基础上设计实现了用于自然图像压缩的模拟退火遗传核函数矢量量化算法.实验结果表明提出的算法在大部分的数据集上都能取得较好的结果。最后,针对LBG算法对初始码书较为敏感的缺点,将免疫克隆选择算法引入进来。使用分裂法产生初始码书。又针对基于欧氏距离的相似性度量仅能反映聚类结果的局部一致性特征,而无法反映聚类的全局一致性的缺点,进而提出了使用基于流形距离的免疫克隆选择聚类方法,通过对31组数据的聚类以及设计实现用于自然图像压缩的基于流形距离的免疫克隆选择矢量量化码书设计对聚类效果进行验证。通过实验结果得到了提出的算法相对于其它算法具有良好的性能。
【关键词】:聚类 局部学习 矢量量化 核空间 流行距离
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP311.13;TP18
【目录】:
- 摘要5-7
- ABSTRACT7-12
- 符号对照表12-13
- 缩略语对照表13-17
- 第一章 绪论17-35
- 1.1 聚类分析的研究背景和意义17-20
- 1.1.1 聚类的定义17-18
- 1.1.2 聚类的相似性测度18-20
- 1.1.3 聚类算法20
- 1.2 基于智能优化算法的聚类分析的研究进展和现状20-21
- 1.3 矢量量化21-29
- 1.3.1 矢量量化的理论基础22-23
- 1.3.2 矢量量化的定义和基本原理23-25
- 1.3.3 矢量量化中的关键技术25-27
- 1.3.4 性能衡量指标---失真测度27-29
- 1.4 矢量量化技术的研究进展和现状29-33
- 1.4.1 LBG(GLA)算法29-31
- 1.4.2 矢量量化码书设计算法的发展现状31-33
- 1.5 本文章节安排以及研究的主要内容33-35
- 第二章 基于局部学习算子的人工免疫多目标聚类算法35-61
- 2.1 模糊C-均值(C-MEANS)聚类算法35-40
- 2.1.1 模糊集合的基本知识35-36
- 2.1.2 C-均值聚类算法36-38
- 2.1.3 模糊C-MEANS聚类算法38-40
- 2.2 人工免疫系统与多目标优化40-45
- 2.2.1 多目标优化问题40-42
- 2.2.2 自然免疫系统42-43
- 2.2.3 人工免疫系统(AIS,Artificial Immune System)43-44
- 2.2.4 人工免疫系统与多目标优化44-45
- 2.3 克隆选择算法45-50
- 2.3.1 克隆选择原理45
- 2.3.2 克隆选择算法45-46
- 2.3.3 抗体编码和初始抗体群的产生46
- 2.3.4 克隆操作46-50
- 2.4 基于局部学习算子的免疫克隆多目标聚类算法(LCSA-FCM)50-54
- 2.4.1 抗体编码的实现50
- 2.4.2 目标函数的计算50-51
- 2.4.3 最优解的选择51-52
- 2.4.4 局部学习52
- 2.4.5 LCSA-FCM算法步骤52-54
- 2.5 仿真实验及结果分析54-60
- 2.5.1 实验用到的数据集54-56
- 2.5.2 算法参数设置及实验结果56-58
- 2.5.3 算法参数分析58-60
- 2.6 本章小结60-61
- 第三章 模拟退火遗传核空间聚类算法61-89
- 3.1 遗传算法61-65
- 3.1.1 遗传算法的基本原理61
- 3.1.2 染色体编码及初始种群的产生61-62
- 3.1.3 适应度函数62
- 3.1.4 遗传算子62-64
- 3.1.5 遗传聚类算法64-65
- 3.2 模拟退火算法65-67
- 3.3 模拟退火遗传聚类算法67-72
- 3.3.1 初始种群的产生67
- 3.3.2 适应度的计算67-68
- 3.3.3 模拟退火算子68-70
- 3.3.4 交叉操作70-71
- 3.3.5 突变操作71
- 3.3.6 选择操作71-72
- 3.4 基于遗传的模拟退火核函数矢量量化算法72-76
- 3.4.1 Mercer核函数72-73
- 3.4.2 适应度的计算73-74
- 3.4.3 相应的模拟退火算子74-75
- 3.4.4 变异操作75-76
- 3.5 算法框架76-77
- 3.6 实验结果及分析77-88
- 3.6.1 数据聚类78-85
- 3.6.2 图像压缩85-87
- 3.6.3 运行时间比较87-88
- 3.7 本章小结88-89
- 第四章 基于流形距离的克隆选择聚类算法89-105
- 4.1 流行距离89-90
- 4.1.1 针对复杂分布数据存在的问题89-90
- 4.1.2 流形距离90
- 4.2 基于流形距离的遗传码书设计算法90-92
- 4.2.1 适应度函数计算90-91
- 4.2.2 抗体编码及初始种群的形成91
- 4.2.3 基于流形距离的遗传码书设计算法91-92
- 4.3 基于流形距离的克隆选择码书设计算法92-93
- 4.3.1 适应度函数的计算92
- 4.3.2 初始抗体群的形成92-93
- 4.3.3 基于流形距离的克隆选择码书设计算法93
- 4.4 实验结果及分析93-103
- 4.4.1 实验设置94-95
- 4.4.2 基于CSAMD、GAMD和C-MEANS的数据聚类95-100
- 4.4.3 基于CSAMD、GAMD和CMMD的图像压缩100-101
- 4.4.4 基于CSAMD、GAMD和LBG码书应用于图像压缩101-103
- 4.5 本章小结103-105
- 第五章 结论和展望105-107
- 5.1 研究结论105-106
- 5.2 研究展望106-107
- 参考文献107-115
- 致谢115-117
- 作者简介117-119
【参考文献】
中国博士学位论文全文数据库 前1条
1 陆哲明;矢量量化编码算法及应用研究[D];哈尔滨工业大学;2001年
本文关键词:基于智能优化算法的聚类分析及应用,由笔耕文化传播整理发布。
本文编号:453509
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/453509.html