基于改进布谷鸟算法的聚类问题的研究
发布时间:2021-12-24 11:24
随着大数据时代的来临和云计算技术的发展,数据爆炸式增长。面对如此大量繁杂的数据,如何从这些海量数据中挖掘出有价值的信息是我们必须解决的问题。聚类问题作为数据挖掘体系中最重要的研究方向之一,其在诸多领域上都有着广泛的应用,选取合理的问题模型和方法,可以有效地从海量数据中得到所需要的有效信息并加以利用。本文针对带容量约束的聚类模型(CCP)进行研究,这是一种典型的聚类经典定位问题。针对原始的聚类方法依赖初始解、容易陷入局部最优的缺点,本文提出了改进的布谷鸟搜索算法求解问题。首先布谷鸟搜索算法(CS)具有较强的全局搜索能力及交互能力,能够通过莱维飞行的更新机制逃离局部最优陷阱,提高了种群的多样性,具有一定的优势。其次,在此算法基础上,为了提高CS算法搜索效率,用K-Means确定初始中心,快速产生初始解;同时利用环交换邻域搜索(CT)来对解进行进一步优化,在数据集中寻找可行负环,扩大解的空间搜索范围,改进了解的质量,能够更加快速地求得问题的近似最优解。本文采用OR-Library库中的数据集作为实例数据源进行了实验对比,运用MATLAB语言编写了计算程序。结果表明:在实验所采用的标准数据集上...
【文章来源】:辽宁科技大学辽宁省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
来自Osman和Christofides最著名的测试问题20的解决方案
2.聚类问题的相关技术研究16由此可见,我们还需要提出更好的聚类优化算法进行求解CCP聚类问题,才能更好的提高解的质量。K-Means算法的分配图如图2.3所示:图2.3K-Means算法分配图Fig.2.3K-MeansalgorithmallocationGraph2.6.3K-Means算法的优缺点K-Means聚类分析算法在聚类分析中的应用程度广泛,算法易实现且步骤简单,通俗易懂,十分容易使用各大汇编语言进行代码实现。虽然K-Means聚类模型算法的优点非常可观,但实际上也存在着很多的不足,总结如下:(1)K-Means聚类算法非常易懂简单,方便编程;(2)适合于线性聚类值数据的聚类[45];(3)K-means算法对于处理球形结构存储的数据更好。K-Means算法的缺点:(1)算法对于全局的搜索性较差,结果不能收敛到所有类别点中的最优解;(2)噪声会对K-Means聚类的结果带来影响[46];(3)不处理高维数据集,聚类效应更严重;(4)算法的时间复杂度不容易被K-Means算法的方法控制,这取决于初始集群中心的选择,这不是由于初始类中心,它在时间复杂度上是高的,很容易导致错误的结果聚类;(5)K-Means聚类算法在处理大型数据集性能较差[47];(6)仅能发现球状类。
从点(0,0)点起始开始标记(●),随即进行50次莱维飞行的轨迹
【参考文献】:
期刊论文
[1]多距离聚类有效性指标研究[J]. 刘丛,陈倩倩,陈应霞. 小型微型计算机系统. 2019(10)
[2]K-means算法聚类中心选取[J]. 张朝,郭秀娟,张坤鹏. 吉林大学学报(信息科学版). 2019(04)
[3]基于复合布谷鸟算法的彩色图像多阈值分割[J]. 邓小亚. 计算机与数字工程. 2019(04)
[4]基于CS优化神经网络的模拟电路故障诊断[J]. 胡鸿志,岑德炼,徐翠锋,滕全进. 计算机工程与设计. 2019(04)
[5]基于改进蚁群算法的聚类分析方法研究[J]. 武书舟,闫丽娜,张秋艳,申晓留. 计算机与数字工程. 2018(09)
[6]布谷鸟搜索算法在人群疏散中的应用研究[J]. 郑洪清,邓舒婷,谢聪. 数学的实践与认识. 2018(14)
[7]基于人工蜂群优化的K均值聚类算法[J]. 廖伍代,朱范炳,王海泉,孙雪凯. 计算机测量与控制. 2018(04)
[8]基于离散布谷鸟算法求解带时间窗和同时取送货的车辆路径问题[J]. 王超,刘超,穆东,高扬. 计算机集成制造系统. 2018(03)
[9]空间密度相似性度量K-means算法[J]. 薛卫,杨荣丽,赵南,徐焕良,任守纲. 小型微型计算机系统. 2018(01)
[10]可变网格优化的K-means聚类方法[J]. 万静,张超,何云斌,李松. 小型微型计算机系统. 2018(01)
硕士论文
[1]人工鱼群K-means算法及其在通信客户细分中的应用研究[D]. 郭永峰.合肥工业大学 2017
[2]数据挖掘中聚类算法的并行优化研究[D]. 范毅刚.西安电子科技大学 2015
[3]数据挖掘中基于遗传算法的K-means聚类算法的研究及应用[D]. 赵松.浙江工业大学 2014
本文编号:3550400
【文章来源】:辽宁科技大学辽宁省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
来自Osman和Christofides最著名的测试问题20的解决方案
2.聚类问题的相关技术研究16由此可见,我们还需要提出更好的聚类优化算法进行求解CCP聚类问题,才能更好的提高解的质量。K-Means算法的分配图如图2.3所示:图2.3K-Means算法分配图Fig.2.3K-MeansalgorithmallocationGraph2.6.3K-Means算法的优缺点K-Means聚类分析算法在聚类分析中的应用程度广泛,算法易实现且步骤简单,通俗易懂,十分容易使用各大汇编语言进行代码实现。虽然K-Means聚类模型算法的优点非常可观,但实际上也存在着很多的不足,总结如下:(1)K-Means聚类算法非常易懂简单,方便编程;(2)适合于线性聚类值数据的聚类[45];(3)K-means算法对于处理球形结构存储的数据更好。K-Means算法的缺点:(1)算法对于全局的搜索性较差,结果不能收敛到所有类别点中的最优解;(2)噪声会对K-Means聚类的结果带来影响[46];(3)不处理高维数据集,聚类效应更严重;(4)算法的时间复杂度不容易被K-Means算法的方法控制,这取决于初始集群中心的选择,这不是由于初始类中心,它在时间复杂度上是高的,很容易导致错误的结果聚类;(5)K-Means聚类算法在处理大型数据集性能较差[47];(6)仅能发现球状类。
从点(0,0)点起始开始标记(●),随即进行50次莱维飞行的轨迹
【参考文献】:
期刊论文
[1]多距离聚类有效性指标研究[J]. 刘丛,陈倩倩,陈应霞. 小型微型计算机系统. 2019(10)
[2]K-means算法聚类中心选取[J]. 张朝,郭秀娟,张坤鹏. 吉林大学学报(信息科学版). 2019(04)
[3]基于复合布谷鸟算法的彩色图像多阈值分割[J]. 邓小亚. 计算机与数字工程. 2019(04)
[4]基于CS优化神经网络的模拟电路故障诊断[J]. 胡鸿志,岑德炼,徐翠锋,滕全进. 计算机工程与设计. 2019(04)
[5]基于改进蚁群算法的聚类分析方法研究[J]. 武书舟,闫丽娜,张秋艳,申晓留. 计算机与数字工程. 2018(09)
[6]布谷鸟搜索算法在人群疏散中的应用研究[J]. 郑洪清,邓舒婷,谢聪. 数学的实践与认识. 2018(14)
[7]基于人工蜂群优化的K均值聚类算法[J]. 廖伍代,朱范炳,王海泉,孙雪凯. 计算机测量与控制. 2018(04)
[8]基于离散布谷鸟算法求解带时间窗和同时取送货的车辆路径问题[J]. 王超,刘超,穆东,高扬. 计算机集成制造系统. 2018(03)
[9]空间密度相似性度量K-means算法[J]. 薛卫,杨荣丽,赵南,徐焕良,任守纲. 小型微型计算机系统. 2018(01)
[10]可变网格优化的K-means聚类方法[J]. 万静,张超,何云斌,李松. 小型微型计算机系统. 2018(01)
硕士论文
[1]人工鱼群K-means算法及其在通信客户细分中的应用研究[D]. 郭永峰.合肥工业大学 2017
[2]数据挖掘中聚类算法的并行优化研究[D]. 范毅刚.西安电子科技大学 2015
[3]数据挖掘中基于遗传算法的K-means聚类算法的研究及应用[D]. 赵松.浙江工业大学 2014
本文编号:3550400
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3550400.html