基于K-means算法及层次聚类算法的研究与应用
本文关键词:基于K-means算法及层次聚类算法的研究与应用
更多相关文章: 聚类改进 k-means算法 算法实现 凝聚型层次聚类算法
【摘要】:随着世界上各行各业的快速发展,人们面临着越来越多的数据,大数据的时代已经到来,人们开始探索研究大数据为生活以及社会活动带来的影响。在研究中,对大数据的处理方法成为备受关注的热点之一。在对大量数据的处理中,聚类分析是一个重要的手段。在医疗诊断、图像处理、信息检索、统计学、生物学等领域的应用都非常广泛。由于聚类算法在应用中呈现的算法简单、容易实现且应用效果较好,从而引起了专家学者的广泛关注。随着聚类算法的应用领域的不断拓宽,使得人们对聚类算法的研究成为数据挖掘领域的一个热点问题,也使其成为是利用计算机实现低级视觉到高级视觉的核心环节。本文在学习基于大数据背景下的聚类算法的原理与应用的基础上,借鉴前人的研究经验,对算法的产生、原理及实现进行了研究,同时对聚类算法进行了实验对比,通过分析聚类的效果验证了算法的可行性和具体应用条件。本论文主要描述了K-means算法、层次聚类算法的原理和实现方法及其优缺点,并针对算法存在的缺点进行改进,提出改进方案;对K-means算法的初始聚类中心点选取对聚类效果的影响进行分析;对于层次聚类算法在聚类中存在合并点选择的难题进行实验分析;对K-means算法和层次聚类算法的聚类效果进行了实验对比。以逐步改进算法聚类效果为目的,为实际应用提供可靠依据,我们使用Java软件对分割算法进行了仿真,取得了一定的研究经验。最后,对聚类算法的改进过程进行记录,测试改进的算法,使它给出在某种环境和数据范围下会产生更好的聚类结果。为聚类算法在数据处理中的应用提供了参考依据,为解决其它类似复杂模式的识别问题的研究提供重要启示。
【关键词】:聚类改进 k-means算法 算法实现 凝聚型层次聚类算法
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第1章 概述10-14
- 1.1 研究背景及选题意义10
- 1.2 国内外的研究现状10-12
- 1.3 论文的内容12-13
- 1.4 论文主要创新点13
- 1.5 本章小结13-14
- 第2章 聚类算法的原理14-27
- 2.1 聚类算法的概述以及相关术语14-15
- 2.2 基本聚类算法15-23
- 2.2.1 基于划分的聚类及性能的分析15-20
- 2.2.2 基于层次的聚类及性能的分析20-21
- 2.2.3 基于密度的聚类算法21-23
- 2.3 AP聚类算法23-26
- 2.3.1 AP聚类算法概述23-24
- 2.3.2 AP聚类算法的相似度矩阵24-25
- 2.3.3 AP聚类算法的信息参量矩阵25-26
- 2.3.4 AP聚类算法的步骤与具体流程26
- 2.4 本章小结26-27
- 第3章 聚类方法的改进27-34
- 3.1 基于K-MEANS聚类改进27-30
- 3.1.1 基本定义27-28
- 3.1.2 算法描述28-29
- 3.1.3 算法实验29-30
- 3.2 层次聚类算法研究及改进30-32
- 3.2.1 研究基础30-31
- 3.2.2 层次聚类的改进31-32
- 3.2.3 实验仿真32
- 3.3 本章小结32-34
- 第4章 聚类算法的实现与应用34-43
- 4.1 代码编写34-37
- 4.2 算法检验37-41
- 4.2.1 在教学质量管理中的应用37-39
- 4.2.2 算法可视化39-41
- 4.3 K-MEANS聚类算法的现实数据的测试41-42
- 4.4 本章小结42-43
- 第5章 结论建议43-45
- 参考文献45-50
- 致谢50
【相似文献】
中国期刊全文数据库 前10条
1 陈旭玲;楼佩煌;;改进层次聚类算法在文献分析中的应用[J];数值计算与计算机应用;2009年04期
2 杨栋;詹海亮;苏锦旗;;基于区域最近邻生长的层次聚类算法[J];化工自动化及仪表;2010年05期
3 王娴;杨绪兵;周宇;周溜溜;;一种基于类中心矫正的层次聚类算法[J];微电子学与计算机;2011年10期
4 谢振平;王士同;王晓明;;一种基于软边界球分的分裂式层次聚类算法[J];模式识别与人工智能;2008年04期
5 姚玉钦;李金广;;一种基于网格的层次聚类算法[J];河南师范大学学报(自然科学版);2009年04期
6 李俊辉;;基于不确定图的层次聚类算法研究[J];中国管理信息化;2012年24期
7 李新良;;基于层次聚类算法的改进研究[J];软件导刊;2007年19期
8 刘兴波;;凝聚型层次聚类算法的研究[J];科技信息(科学教研);2008年11期
9 郭晓娟;刘晓霞;李晓玲;;层次聚类算法的改进及分析[J];计算机应用与软件;2008年06期
10 史变霞;张明新;;一种改进的层次聚类算法[J];微电子学与计算机;2010年12期
中国重要会议论文全文数据库 前3条
1 马晓艳;唐雁;;层次聚类算法研究[A];2008年计算机应用技术交流会论文集[C];2008年
2 饶金通;董槐林;姜青山;;基于孤立因子的层次聚类算法与应用[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 吴楠楠;史亮;饶金通;姜青山;董槐林;;一种改进的高效层次聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前1条
1 陈远浩;非监督的结构学习及其应用[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 郭芳芳;面向分类型集值数据的层次聚类算法研究[D];山西大学;2015年
2 李彩云;基于密度的改进型层次聚类算法研究[D];兰州大学;2016年
3 乔端瑞;基于K-means算法及层次聚类算法的研究与应用[D];吉林大学;2016年
4 瞿俊;基于重叠度的层次聚类算法研究及其应用[D];厦门大学;2007年
5 杨海斌;一种新的层次聚类算法的研究及应用[D];西北师范大学;2011年
6 张冬梅;基于轮廓系数的层次聚类算法研究[D];燕山大学;2010年
7 李慧驰;基于三度信息的双重层次聚类算法[D];武汉理工大学;2013年
8 张文开;基于密度的层次聚类算法研究[D];中国科学技术大学;2015年
9 段明秀;层次聚类算法的研究及应用[D];中南大学;2009年
10 李欣欣;基于MPI的层次聚类算法的研究及实现[D];哈尔滨理工大学;2012年
,本文编号:903923
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/903923.html