基于遗传算法和共协矩阵的聚类融合算法研究
发布时间:2023-06-01 19:56
随着聚类分析的发展,聚类融合研究日趋成熟但也面临着许多问题。由于缺少数据分类的先验信息,聚类融合产生的基聚类受聚类算法影响明显;大部分一致性集成函数使用的共协矩阵只考虑数据对出现在同一个簇的概率,对于基聚类信息的利用率不高;聚类融合计算过程存在时间、空间复杂度高等问题。本文对聚类融合中的一致性集成函数、共协矩阵和并行应用三个方面进行了研究。将改进后的遗传算法作为一致性集成函数保证了基聚类的准确性和多样性,改进后的共协矩阵用于一致性集成函数中提供了更多信息,两者一起应用提高了算法效果。最后,在Hadoop平台上使用MapReduce框架实现算法的并行提高了算法效率。同时,将并行算法应用到医学研究数据集上,为早期癌症发现和预防提供指导。具体研究成果如下:(1)提出了基于遗传算法的聚类融合算法(CEGA)。针对聚类融合要求基聚类准确性高、差异性高等特点,本文将遗传算法用作一致性集成函数。并根据聚类融合目标设计了适应度函数,根据基聚类最多重叠元素数量设计了选择算子。实验分析了遗传算法中适应度函数和选择算子对CEGA算法的影响;同时将CEGA算法与其它常用聚类融合算法在数据集上进行比较实验,证明...
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外相关研究与应用现状
1.3 主要研究内容
1.4 论文组织结构
第二章 聚类融合算法相关研究概述
2.1 一致性集成函数概述
2.2 共协矩阵概述
2.3 常用评价指标
2.4 本章小结
第三章 基于遗传算法的并行聚类融合
3.1 遗传算法的改进
3.1.1 种群初始化
3.1.2 适应度函数
3.1.3 选择算子
3.1.4 交叉操作和基因突变
3.1.5 精英策略
3.2 基于遗传算法的聚类融合算法
3.3 基于遗传算法的并行聚类融合算法
3.4 实验结果与分析
3.4.1 遗传算法的影响
3.4.2 算法性能分析
3.4.3 并行算法分析
3.5 本章小结
第四章 基于遗传算法和共协矩阵的并行聚类融合
4.1 共协矩阵的改进
4.2 基于遗传算法和共协矩阵的聚类融算法
4.3 实验结果与分析
4.3.1 基聚类数量分析
4.3.2 Parzen窗口分析
4.3.3 算法性能分析
4.3.4 并行算法分析
4.4 基于遗传算法和共协矩阵的并行聚类融合算法在医学中的应用
4.5 本章小结
第五章 结束语
5.1 总结
5.2 展望
致谢
参考文献
作者简介
本文编号:3826944
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外相关研究与应用现状
1.3 主要研究内容
1.4 论文组织结构
第二章 聚类融合算法相关研究概述
2.1 一致性集成函数概述
2.2 共协矩阵概述
2.3 常用评价指标
2.4 本章小结
第三章 基于遗传算法的并行聚类融合
3.1 遗传算法的改进
3.1.1 种群初始化
3.1.2 适应度函数
3.1.3 选择算子
3.1.4 交叉操作和基因突变
3.1.5 精英策略
3.2 基于遗传算法的聚类融合算法
3.3 基于遗传算法的并行聚类融合算法
3.4 实验结果与分析
3.4.1 遗传算法的影响
3.4.2 算法性能分析
3.4.3 并行算法分析
3.5 本章小结
第四章 基于遗传算法和共协矩阵的并行聚类融合
4.1 共协矩阵的改进
4.2 基于遗传算法和共协矩阵的聚类融算法
4.3 实验结果与分析
4.3.1 基聚类数量分析
4.3.2 Parzen窗口分析
4.3.3 算法性能分析
4.3.4 并行算法分析
4.4 基于遗传算法和共协矩阵的并行聚类融合算法在医学中的应用
4.5 本章小结
第五章 结束语
5.1 总结
5.2 展望
致谢
参考文献
作者简介
本文编号:3826944
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3826944.html