当前位置:主页 > 科技论文 > 自动化论文 >

K-Means算法研究及其与智能算法的融合

发布时间:2017-09-18 04:34

  本文关键词:K-Means算法研究及其与智能算法的融合


  更多相关文章: 数据挖掘 聚类分析 遗传算子 K-Means算法 蚁群算法


【摘要】:随着大数据时代的到来,从海量数据中获取有价值信息的需求日益增加,迫切需要一些新的方法来处理海量数据。聚类分析作为数据挖掘中的重要组成部分,对数据挖掘技术的发展有着重要意义。聚类分析不仅可以单独对数据集进行处理,获得需要的数据分布情况,还能够作为其他数据挖掘算法的数据前期预处理操作。针对传统方法在解决现有问题上的不足,和更好的对海量数据进行处理,发现数据集中隐含的有价值信息,以及能更全面、更高效的满足实际应用需要,亟需对相关聚类方法进行深入研究。K-Means聚类算法是一种思想简单易于实现,并且收敛速度快的经典聚类方法,该算法存在的主要缺点是初始化时需要明确给出数据集要聚成簇的数目和初始的聚类中心。群体智能算法是一种模拟群体生物生活习性的优化搜索算法,遗传算法和蚂蚁算法是其代表性算法。遗传算法是对整个解空间进行搜索并且下一代的产生是通过遗传操作获得,所以能够增加解的多样性,扩大搜索范围,避免收敛于局部最优解。蚂蚁算法具有较强适应性,能处理多种类型数据并且能够发现最优解,并且还具有易于与其他智能算法或聚类算法结合成高效、新型组合算法的优点。本文主要是对聚类算法和智能算法进行研究。首先对聚类分析的相关内容进行了介绍,详细分析了聚类的要求、评价准则和经典的聚类方法等,然后介绍了群体智能的相关概念,主要分析了遗传算法和蚂蚁算法的原理及算法流程和优缺点。由于蚁群聚类算法存在前期收敛速度慢,后期出现易早熟的缺点,有学者针对K-Means聚类算法收敛速度快和蚂蚁算法能获得最优解的优点提出将两者相结合的算法,但该算法并没有改善后期易早熟的问题。针对现有方法在后期易陷入早熟的缺点,本文提出在算法迭代后期引入遗传算法中的变异算子,增加解的多样性,扩大搜索范围。通过采用UCI数据集中数据,以及与蚂蚁聚类算法、原有K-Means蚁群聚类算法的对比实验验证改进的新算法能够有效改善收敛局部最优的问题,并且保留了原有算法加快收敛速度的优点。针对K-Means聚类算法初始簇数目值的给定以及随机选择聚类中心对聚类结果产生较大波动的弊端,结合层次聚类的分裂和凝聚思想,提出基于最小生成树的层次K-Means聚类算法,通过仿真实验验证了该算法的有效性。
【关键词】:数据挖掘 聚类分析 遗传算子 K-Means算法 蚁群算法
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18;TP311.13
【目录】:
  • 摘要3-5
  • Abstract5-9
  • 第1章 绪论9-14
  • 1.1 研究的背景与意义9-10
  • 1.2 国内外研究现状10-13
  • 1.3 论文内容安排13-14
  • 1.3.1 本文主要研究内容13
  • 1.3.2 章节安排13-14
  • 第2章 聚类算法概述14-21
  • 2.1 聚类算法的要求14-15
  • 2.2 数据样本相似性判定15-16
  • 2.3 聚类的评价准则16-17
  • 2.4 聚类算法介绍17-20
  • 2.5 本章小结20-21
  • 第3章 群体智能的基本理论21-30
  • 3.1 遗传算法的基本原理21-23
  • 3.1.1 遗传算法的重要特征21-22
  • 3.1.2 遗传算法的主要运算过程22-23
  • 3.2 蚁群算法的基本描述23-25
  • 3.3 蚁群算法优缺点分析25-27
  • 3.4 蚁群聚类算法27-29
  • 3.4.1 基于觅食原理的蚁群聚类算法27-28
  • 3.4.2 基于蚁堆的蚁群聚类算法28-29
  • 3.5 本章小结29-30
  • 第4章 一种改进的K-Means蚁群聚类算法30-37
  • 4.1 K-Means和蚂蚁聚类算法的结合30-32
  • 4.1.1 基于信息素的蚂蚁聚类算法和K-Means算法的结合31-32
  • 4.1.2 基于蚁堆聚类算法和K-Means算法的结合32
  • 4.2 一种改进的K-Means蚂蚁聚类算法32-34
  • 4.2.1 现有算法的优缺点32
  • 4.2.2 本文改进思想32-33
  • 4.2.3 算法的具体步骤33-34
  • 4.3 仿真实验34-36
  • 4.4 本章小结36-37
  • 第5章 基于最小生成树的层次K-Means聚类算法37-46
  • 5.1 改进K-Means算法介绍37-38
  • 5.2 Prim算法38
  • 5.3 基于最小生成树的层次K-Means算法38-45
  • 5.3.1 改进思想38-39
  • 5.3.2 算法具体实现步骤39-40
  • 5.3.3 仿真实验40-45
  • 5.4 本章小结45-46
  • 第6章 总结与展望46-48
  • 6.1 总结46
  • 6.2 展望46-48
  • 参考文献48-52
  • 致谢52-53
  • 附录 (攻读硕士学位期间发表录用论文)53

【相似文献】

中国期刊全文数据库 前10条

1 冯舜玺;;新书推荐:《算法分析导论》[J];计算机教育;2006年05期

2 张力,慕晓冬;计算机算法分析浅谈[J];武警工程学院学报;2002年04期

3 马安光;;飞弹问题的算法分析——2003年第10期题解[J];程序员;2003年12期

4 苏运霖;;《算法分析导论》评介[J];计算机教育;2006年07期

5 朱力强;;培养学生创新思维与能力的算法分析案例[J];计算机与信息技术;2007年11期

6 汪菊琴;;几种常见特殊方阵的算法分析与实现[J];无锡职业技术学院学报;2009年05期

7 李涵;;“算法分析与设计”课程教学改革和实践[J];中国电力教育;2010年16期

8 刘宁;管涛;;浅析案例教学法在算法分析与设计课程中的应用[J];科技风;2011年07期

9 胡峰;王国胤;;“算法分析与设计”教学模式探索[J];当代教育理论与实践;2011年12期

10 赵娟;;浅析启发式教学法在《算法分析与设计》课程中的应用[J];福建电脑;2012年06期

中国重要会议论文全文数据库 前10条

1 俞洋;田亚菲;;一种新的变步长LMS算法及其仿真[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

2 周颢;刘振华;赵保华;;构造型的D~2FA生成算法[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

3 赖桃桃;冯少荣;张东站;;一种基于划分和密度的快速聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

4 刘远新;邓飞其;罗艳辉;舒添慧;;ERP柔性平台下物流运输配送系统算法分析[A];第二十六届中国控制会议论文集[C];2007年

5 王树西;白硕;姜吉发;;模式合一的“减首去尾”算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年

6 王万青;张晓辉;;改进的A~*算法的高效实现[A];2009全国测绘科技信息交流会暨首届测绘博客征文颁奖论文集[C];2009年

7 孙焕良;邱菲;刘俊岭;朱叶丽;;IncSNN——一种基于密度的增量聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

8 韩建民;岑婷婷;于娟;;实现敏感属性l-多样性的l-MDAV算法[A];第二十七届中国控制会议论文集[C];2008年

9 张悦;尤枫;赵瑞莲;;利用蚁群算法实现基于程序结构的主变元分析[A];第五届中国测试学术会议论文集[C];2008年

10 王旭东;刘渝;邓振淼;;正弦波频率估计的修正Rife算法及其FPGA实现[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年

中国重要报纸全文数据库 前1条

1 科文;VIXD算法分析Web异常[N];中国计算机报;2008年

中国博士学位论文全文数据库 前10条

1 魏哲学;样本断点距离问题的算法与复杂性研究[D];山东大学;2015年

2 刘春明;基于增强学习和车辆动力学的高速公路自主驾驶研究[D];国防科学技术大学;2014年

3 张敏霞;生物地理学优化算法及其在应急交通规划中的应用研究[D];浙江工业大学;2015年

4 李红;流程挖掘算法研究[D];云南大学;2015年

5 盛歆漪;粒子群优化算法及其应用研究[D];江南大学;2015年

6 黄磊;高动态环境捷联惯导信号处理及高精度姿态速度算法研究[D];南京航空航天大学;2015年

7 刘新旺;多核学习算法研究[D];国防科学技术大学;2013年

8 于滨;城市公交系统模型与算法研究[D];大连理工大学;2006年

9 曾国强;改进的极值优化算法及其在组合优化问题中的应用研究[D];浙江大学;2011年

10 肖永豪;蜂群算法及在图像处理中的应用研究[D];华南理工大学;2011年

中国硕士学位论文全文数据库 前10条

1 黄厦;基于改进蚁群算法的柔性作业车间调度问题研究[D];昆明理工大学;2015年

2 李平;基于Hadoop的信息爬取与舆情检测算法研究[D];昆明理工大学;2015年

3 赵官宝;基于位表的关联规则挖掘算法研究[D];昆明理工大学;2015年

4 殷文华;移动容迟网络中基于社会感知的多播分发算法研究[D];内蒙古大学;2015年

5 徐翔燕;人工鱼群优化算法及其应用研究[D];西南交通大学;2015年

6 李德福;基于小世界模型的启发式寻路算法研究[D];华中师范大学;2015年

7 郑海彬;一种面向MAPREDUCE的DATASHUFFLE的优化方法[D];苏州大学;2015年

8 赵晓寒;轮换步长PSO算法及SMVSC参数优化[D];沈阳理工大学;2015年

9 安丰洋;基于无线网络的广播算法研究[D];曲阜师范大学;2015年

10 李智明;基于改进FastICA算法的混合语音盲分离[D];上海交通大学;2015年



本文编号:873447

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/873447.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0e290***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com