当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于狼群算法的K-means算法及应用实现

发布时间:2020-09-21 10:28
   数据挖掘是当前研究者们普遍关注的一个热点问题,尤其在人工智能和数据库领域。传统意义上的数据挖掘是指,从现有的数据库的海量数据中研究、挖掘出潜在的、尚未被人知晓的有用信息的非平凡过程。随着科学技术的不断发展,在机器学习、可视化技术、人工智能、模式识别、统计学、数据库等多个领域,都需要人们基于以往的数据案例,进行分析并做出决策等。数据挖掘的意义之一就是提供决策支持,基于已有的企业数据,它能进行有效的自动化的分析、归纳、推理,实现从海量数据中挖掘出潜在的规律或模式,帮助企业决策者们及时调整市场发展规划,规避风险,进而做出正确的决策。在当前应用于计算机数据分析的各种方法中,聚类分析作为数据分析中非常重要的一类课题,也是数据挖掘中的一种关键性方法手段。聚类分析可以在海量的数据中挖掘出隐含其中的数据分布规律和数据模式,是研究分类问题中的一种重要的统计方法。它将数据对象的集合依据数据的相似度进行分类,使得相似度高的数据划为一类簇,相似度低的数据区分到不同的簇中。如果在聚类分析时,采用不同的方式手段,通常会产生不同的结果,而即使对于同样的一组数据,由不同的研究者们进行聚类的分析,所得到的簇的种类也可能不尽相同。非层次聚类分析中的K-means因其实现简单、收敛速度快的优点成为最为常用的聚类算法,它以欧式距离作为一种度量准则,在此基础之上,将实验数据划分为不同的类别。然而,聚类中心选择的不同,在极大程度上会影响K-means的聚类效果,如果只是随机地选取聚类中心,极易使算法陷入局部的最优值,无法实现最优效果。由于研究人员在宏观上对数据是未知的,所以,在聚类个数k的选择过程中,只能设置多个不同的k值,并且通过多次实验,从而来确定聚类的个数。并且不同的初始聚类中心或造成不同的初始搜索范围,而不同的初始搜索范围会形成不同的搜索区域,不同的搜索区域也会找到不同的最优解,因此,初始聚类中心的不确定使得K-means算法缺乏较好的稳定性。因此,本文主要研究以下四个方面的内容:(1)在猛狼进行更新位置更新的时候,加入猛狼的历史最优位置;(2)为了使得算法在前期拥有更好的全局搜索能力,在后期拥有较强的局部勘探能力,提出了自适应步长公式;(3)提出基于狼群算法的K-means聚类分析算法,用于优化K-means聚类算法中的参数;(4)将提出的方法在聚类分析问题上进行应用,并和其它同类方法进行对比研究。
【学位单位】:吉林大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP18;TP311.13
【部分图文】:

算法流程图,初始聚类中心,数据集,聚类


图 2.1 K-means 算法流程图,Forgy 法使得初始平均值都分散开来,而随机落在数据集的中心周围。同时 K-means 算法不能保其聚类结果很大程度上取决于初始聚类中心。

迭代,聚类算法


K-means聚类算法迭代图

流程图,粒子群算法,流程图,伪代码


图 2-2 粒子群算法流程图小结叙述了 K-means 聚类算法、原始狼群算法以及粒子群狼群算法和粒子群算法的实现伪代码、流程图和参数法的缺陷,为第三章和第四章提供理论基础。

【相似文献】

相关期刊论文 前10条

1 赵贵喜;刘永波;王岩;郑洪涛;;数据场和K-Means算法融合的雷达信号分选[J];雷达科学与技术;2016年05期

2 赵红丹;田喜平;;基于K-means算法分割遥感图像的阈值确定方法研究[J];科学技术与工程;2017年09期

3 严旭;王青海;;基于变精度粗糙集改进K-means聚类算法[J];办公自动化;2017年08期

4 李敬强;王蓓;赵宁;李灏;王勇;;基于k-means聚类的管制员注意品质特征研究[J];中国安全科学学报;2017年06期

5 袁周米琪;周坚华;;自适应确定K-means算法的聚类数:以遥感图像聚类为例[J];华东师范大学学报(自然科学版);2014年06期

6 周翔;王丰华;傅坚;林嘉杨;金之俭;;基于混沌理论和K-means聚类的有载分接开关机械状态监测[J];中国电机工程学报;2015年06期

7 冷泳林;张清辰;赵亮;鲁富宇;;基于离群点检测的K-means算法[J];渤海大学学报(自然科学版);2014年01期

8 何慧;胡小红;覃华;张敏;;用核K-means聚类减样法优化半定规划支持向量机[J];江西师范大学学报(自然科学版);2013年06期

9 李学勇;高国红;孙甲霞;;基于互信息和K-means聚类的信息安全风险评估[J];河南师范大学学报(自然科学版);2011年02期

10 边鹏;赵妍;苏玉召;;一种改进的K-means算法最佳聚类数确定方法[J];现代图书情报技术;2011年09期

相关会议论文 前10条

1 张世海;张世忠;段慧杰;;高层结构方案设计的K-Means聚类分析法[A];计算机技术在工程设计中的应用——第十六届全国工程设计计算机应用学术会议论文集[C];2012年

2 赵伟;张姝;李文辉;;一种快速的基于K-Means算法的空间索引方法[A];中国几何设计与计算新进展2007——第三届中国几何设计与计算大会论文集[C];2007年

3 王鑫;黄忠义;;网络资源中基于K-Means聚类的个性化推荐[A];2013年全国通信软件学术会议论文集[C];2013年

4 任家东;孟丽丽;张冬梅;;一种基于网格的改进的K-Means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

5 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年

6 郑丽媛;;基于K-Means聚类分析法的山西省资源现状评价研究[A];第一届中国西部矿山地质环境保护学术论坛论文摘要集[C];2017年

7 华勇攀;李梦龙;朱敏;;基于SVM和K-means算法识别蛋白质结构域[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

8 张华;李道煜;于忠清;董强;;可重构硬件实现K-means聚类算法研究[A];2005年中国智能自动化会议论文集[C];2005年

9 宋亚奇;李莉;朱永利;;基于并行化半监督K-means聚类的电网设备状态评估[A];中国电机工程学会第十三届青年学术会议论文摘要集[C];2014年

10 吴杰;许映秋;钮伟;谈英姿;;RoboCup救援仿真中基于K-means算法的警察分区策略[A];第三届中国指挥控制大会论文集(下册)[C];2015年

相关博士学位论文 前3条

1 李亚芳;K-means型社区发现方法研究[D];北京交通大学;2017年

2 吴迪;基于加权相似度的序列聚类算法研究[D];燕山大学;2014年

3 罗海艳;移动用户网络行为分析与预测方法研究[D];沈阳农业大学;2015年

相关硕士学位论文 前10条

1 赵微;基于狼群算法的K-means算法及应用实现[D];吉林大学;2019年

2 薛端;基于K-means算法的边缘服务器部署研究[D];云南大学;2018年

3 杨荣丽;K-means算法的改进及其在蛋白质亚细胞区间预测上的应用[D];南京农业大学;2017年

4 张丽丽;基于K-means聚类—层次分析的风电场短期功率预测方法[D];郑州大学;2019年

5 冯曦蒸;基于K-means聚类的WSN分簇式多跳能量路由算法研究[D];西北师范大学;2017年

6 江贺训;基于二分k-means的低功耗路由算法研究[D];合肥工业大学;2018年

7 李中明;基于K-Means聚类算法的商品期货逼仓行为特征分析[D];浙江工商大学;2018年

8 靳姗姗;基于K-means聚类分析的南海水团分布及其季节变化研究[D];国家海洋局第一海洋研究所;2017年

9 赵凤娇;基于K-means算法的水下图像边缘检测[D];中国海洋大学;2015年

10 成娅辉;k-means算法改进及其在通信行业客户细分中的应用[D];湖南大学;2010年



本文编号:2823380

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2823380.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户77d36***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com