当前位置:主页 > 科技论文 > 软件论文 >

基于K-means算法及层次聚类算法的研究与应用

发布时间:2017-09-23 07:17

  本文关键词:基于K-means算法及层次聚类算法的研究与应用


  更多相关文章: 聚类改进 k-means算法 算法实现 凝聚型层次聚类算法


【摘要】:随着世界上各行各业的快速发展,人们面临着越来越多的数据,大数据的时代已经到来,人们开始探索研究大数据为生活以及社会活动带来的影响。在研究中,对大数据的处理方法成为备受关注的热点之一。在对大量数据的处理中,聚类分析是一个重要的手段。在医疗诊断、图像处理、信息检索、统计学、生物学等领域的应用都非常广泛。由于聚类算法在应用中呈现的算法简单、容易实现且应用效果较好,从而引起了专家学者的广泛关注。随着聚类算法的应用领域的不断拓宽,使得人们对聚类算法的研究成为数据挖掘领域的一个热点问题,也使其成为是利用计算机实现低级视觉到高级视觉的核心环节。本文在学习基于大数据背景下的聚类算法的原理与应用的基础上,借鉴前人的研究经验,对算法的产生、原理及实现进行了研究,同时对聚类算法进行了实验对比,通过分析聚类的效果验证了算法的可行性和具体应用条件。本论文主要描述了K-means算法、层次聚类算法的原理和实现方法及其优缺点,并针对算法存在的缺点进行改进,提出改进方案;对K-means算法的初始聚类中心点选取对聚类效果的影响进行分析;对于层次聚类算法在聚类中存在合并点选择的难题进行实验分析;对K-means算法和层次聚类算法的聚类效果进行了实验对比。以逐步改进算法聚类效果为目的,为实际应用提供可靠依据,我们使用Java软件对分割算法进行了仿真,取得了一定的研究经验。最后,对聚类算法的改进过程进行记录,测试改进的算法,使它给出在某种环境和数据范围下会产生更好的聚类结果。为聚类算法在数据处理中的应用提供了参考依据,为解决其它类似复杂模式的识别问题的研究提供重要启示。
【关键词】:聚类改进 k-means算法 算法实现 凝聚型层次聚类算法
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
  • 摘要4-6
  • ABSTRACT6-10
  • 第1章 概述10-14
  • 1.1 研究背景及选题意义10
  • 1.2 国内外的研究现状10-12
  • 1.3 论文的内容12-13
  • 1.4 论文主要创新点13
  • 1.5 本章小结13-14
  • 第2章 聚类算法的原理14-27
  • 2.1 聚类算法的概述以及相关术语14-15
  • 2.2 基本聚类算法15-23
  • 2.2.1 基于划分的聚类及性能的分析15-20
  • 2.2.2 基于层次的聚类及性能的分析20-21
  • 2.2.3 基于密度的聚类算法21-23
  • 2.3 AP聚类算法23-26
  • 2.3.1 AP聚类算法概述23-24
  • 2.3.2 AP聚类算法的相似度矩阵24-25
  • 2.3.3 AP聚类算法的信息参量矩阵25-26
  • 2.3.4 AP聚类算法的步骤与具体流程26
  • 2.4 本章小结26-27
  • 第3章 聚类方法的改进27-34
  • 3.1 基于K-MEANS聚类改进27-30
  • 3.1.1 基本定义27-28
  • 3.1.2 算法描述28-29
  • 3.1.3 算法实验29-30
  • 3.2 层次聚类算法研究及改进30-32
  • 3.2.1 研究基础30-31
  • 3.2.2 层次聚类的改进31-32
  • 3.2.3 实验仿真32
  • 3.3 本章小结32-34
  • 第4章 聚类算法的实现与应用34-43
  • 4.1 代码编写34-37
  • 4.2 算法检验37-41
  • 4.2.1 在教学质量管理中的应用37-39
  • 4.2.2 算法可视化39-41
  • 4.3 K-MEANS聚类算法的现实数据的测试41-42
  • 4.4 本章小结42-43
  • 第5章 结论建议43-45
  • 参考文献45-50
  • 致谢50

【相似文献】

中国期刊全文数据库 前10条

1 陈旭玲;楼佩煌;;改进层次聚类算法在文献分析中的应用[J];数值计算与计算机应用;2009年04期

2 杨栋;詹海亮;苏锦旗;;基于区域最近邻生长的层次聚类算法[J];化工自动化及仪表;2010年05期

3 王娴;杨绪兵;周宇;周溜溜;;一种基于类中心矫正的层次聚类算法[J];微电子学与计算机;2011年10期

4 谢振平;王士同;王晓明;;一种基于软边界球分的分裂式层次聚类算法[J];模式识别与人工智能;2008年04期

5 姚玉钦;李金广;;一种基于网格的层次聚类算法[J];河南师范大学学报(自然科学版);2009年04期

6 李俊辉;;基于不确定图的层次聚类算法研究[J];中国管理信息化;2012年24期

7 李新良;;基于层次聚类算法的改进研究[J];软件导刊;2007年19期

8 刘兴波;;凝聚型层次聚类算法的研究[J];科技信息(科学教研);2008年11期

9 郭晓娟;刘晓霞;李晓玲;;层次聚类算法的改进及分析[J];计算机应用与软件;2008年06期

10 史变霞;张明新;;一种改进的层次聚类算法[J];微电子学与计算机;2010年12期

中国重要会议论文全文数据库 前3条

1 马晓艳;唐雁;;层次聚类算法研究[A];2008年计算机应用技术交流会论文集[C];2008年

2 饶金通;董槐林;姜青山;;基于孤立因子的层次聚类算法与应用[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

3 吴楠楠;史亮;饶金通;姜青山;董槐林;;一种改进的高效层次聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

中国博士学位论文全文数据库 前1条

1 陈远浩;非监督的结构学习及其应用[D];中国科学技术大学;2008年

中国硕士学位论文全文数据库 前10条

1 郭芳芳;面向分类型集值数据的层次聚类算法研究[D];山西大学;2015年

2 李彩云;基于密度的改进型层次聚类算法研究[D];兰州大学;2016年

3 乔端瑞;基于K-means算法及层次聚类算法的研究与应用[D];吉林大学;2016年

4 瞿俊;基于重叠度的层次聚类算法研究及其应用[D];厦门大学;2007年

5 杨海斌;一种新的层次聚类算法的研究及应用[D];西北师范大学;2011年

6 张冬梅;基于轮廓系数的层次聚类算法研究[D];燕山大学;2010年

7 李慧驰;基于三度信息的双重层次聚类算法[D];武汉理工大学;2013年

8 张文开;基于密度的层次聚类算法研究[D];中国科学技术大学;2015年

9 段明秀;层次聚类算法的研究及应用[D];中南大学;2009年

10 李欣欣;基于MPI的层次聚类算法的研究及实现[D];哈尔滨理工大学;2012年



本文编号:903923

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/903923.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0ee8c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com