符号数据聚类算法研究及应用
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图1-1聚类过程??
数据集划分成不同的??簇获得数据中隐藏的有价值信息。数据集可符号化为彻ixm,你}其中iV为??样本数目。1=<11,12,...而....,功>表示任意一个样本,第/(7'=1,2,...,?'/)个样本的第7维属??性(/=1,2,...刀)为^。在硬聚类算法中,2)5通常被....
图2-1不同0值下属性权重的分析??2.4.2聚絲效性指标??
?第二章类属型数据核子空间聚类算法???法是收敛的。??2.4.1关于参数设的讨论??在KSCC聚类过程中,通过核函数直接度量数据间的相似性,在核空间中每个??属性都被自动赋予一个衡量其重要程度的权值,通过特征选择寻找到相应的子空间。??根据公式(9),簇to中属性^的权值计算为....
图2-4原空间中样本分布
,由于DataSetl中只有两个属性相关,所以除KKM[35]2外,??其余算法聚类质量相差不大,KSCC相比KKM[35]由于进行特征选择识别出重要的属??性3与属性4,聚类结果明显较好;从DataSet2和DataSet3中可以看出,随着属性??相关的数目增多,KSCC的聚类....
图2 ̄8不同算法在Breastcancer上独立运行的F-Score指标对比??所提算法以及对比算法分别在真实数据集上运行200次花费的平均时间如图2-??
?福建师范大学硕士学位论文???予它们较大的权重,进一步的说明了核子空间聚类的优势。??以Breastcancer为例,图2-8给出了各类算法运行100次的聚类精度分布,横坐??标代表各算法运行的次数,纵坐标是以F-Score指标衡量每次聚类获得的聚类结果。??如图2-8所示,K....
本文编号:3932401
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3932401.html