当前位置:主页 > 科技论文 > 软件论文 >

模糊C-means聚类算法的拓展研究

发布时间:2021-06-15 13:15
  聚类分析旨在按照特定准则,将数据集中的数据点划分为若干有意义的子集,从而挖掘出数据背后的内在结构信息。聚类分析属于无监督学习方法,在机器学习、数据挖掘和信息处理等领域得到了广泛的应用和快速的发展。在诸多聚类算法中,模糊C-Means(Fuzzy C-Means,简称FCM)是一种极具竞争力的聚类算法,它以C-Means聚类为基础,通过引入模糊隶属度将“硬”聚类推广为“软”聚类,从而将聚类问题转化为对数据点的模糊划分问题。尽管FCM受到了大量地关注和研究,但仍存在问题有待研究。例如,i)在传统FCM的目标函数中并没有顾及到数据集中可能存在的类不平衡问题,由此FCM不适合于对非平衡数据集进行聚类;ii)FCM属于无监督学习方法,没有利用可获得的部分先验(标记)信息,这不符合当前已兴起的半监督学习潮流。因此,如何将传统FCM拓展为更普适的形式是一个值得研究的问题。为了迎合更广泛的应用场景,本文对传统FCM在类不平衡情形和半监督环境下的拓展问题进行了研究。主要研究成果如下:1)提出了一种平衡化FCM聚类算法(Balanced FCM,简称BFCM算法)。针对FCM在聚类非平衡数据集时会产生“均... 

【文章来源】:云南师范大学云南省

【文章页数】:51 页

【学位级别】:硕士

【部分图文】:

模糊C-means聚类算法的拓展研究


BFCM和FCM在四种数据集上不同平滑指数m下的聚类纯度

不同参数,聚类


第 3 章 一种平衡的模糊 C-Means 聚类方法越能使隶属度矩阵逼近正交。但是对于一些数据集,隶属度正交条件可能会导致聚类远离数据的真实分布结构,因此 的选择尚没有理论指导。为了说明不同 值对聚类纯度的影响,我们选择数据集 soybean 和 spiral 进行实验,图 3.2 中是所得实验结果。

聚类,纯度,标号,算法


第 4 章 半监督平衡化模糊 C-Means 聚类4.4.3 监督信息量对聚类效果的影响为了考察不同监督规模对 SBFCM 的影响,在数据集 protein, heart, soybean和 sonar 上,图 4.1 给出了 SBFCM 随监督信息量变化的聚类纯度图。在图 4.1的各子图中,横轴表示给定的类标记数相对于总样本数的比重,纵轴表示获得的聚类纯度。从 4 个子图可以看出,随着监督标记量的增加,SBFCM 获得的聚类纯度也相应提高。特别地,对 soybean 数据集,当监督标记量为 60%时,获得的聚类纯度已达 100%。

【参考文献】:
期刊论文
[1]半监督模糊聚类算法的研究与改进[J]. 白福均,高建瓴,宋文慧,贺思云.  通信技术. 2018(05)
[2]一种基于网格与加权信息熵的OPTICS改进算法[J]. 安建瑞,张龙波,王雷,金超,怀浩,王晓丹.  计算机工程. 2017(02)
[3]广义均衡模糊C均值聚类算法[J]. 文传军,詹永照,柯佳.  系统工程理论与实践. 2012(12)
[4]AGNES算法在K-means算法中的应用[J]. 周爱武,潘勇,崔丹丹,肖云.  微型机与应用. 2011(23)
[5]基于F检验的模糊聚类小额农贷信用风险预测[J]. 韦艳玲.  安徽农业科学. 2011(01)
[6]基于特征加权距离的双指数模糊子空间聚类算法[J]. 王骏,王士同,王晓明.  控制与决策. 2010(08)
[7]模糊聚类理论发展及其应用[J]. 谢维信,高新波,裴继红.  中国体视学与图像分析. 1999(02)
[8]模糊聚类分析的传递方法[J]. 吴福保,李奇,宋文忠.  东南大学学报. 1999(02)

博士论文
[1]基于目标函数的模糊聚类新算法及其应用研究[D]. 汪庆淼.江苏大学 2014



本文编号:3231123

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3231123.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户912a5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com