当前位置:主页 > 科技论文 > 搜索引擎论文 >

自动确定聚类中心的快速搜索和发现密度峰值的聚类算法

发布时间:2024-04-10 20:20
  快速搜索和发现密度峰值的聚类算法(CFSFDP)具有不能自动确定聚类中心的缺点,文中提出自动确定聚类中心的CFSFDP.首先针对变量分布不均匀的问题,将密度和距离进行归一化处理.再通过切比雪夫不等式确定归一化后的密度阈值上限,利用标准差确定归一化后的距离阈值上限.最后根据决策函数确定决策阈值上限,统筹考虑两种决定因素,避免中心点选取遗漏,自动确定聚类中心.实验表明,文中算法可以有效地自适应选择聚类中心,具有较好的鲁棒性和有效性.

【文章页数】:10 页

【部分图文】:

图4各算法运行时间对比

图4各算法运行时间对比

综上所述,AUTO-CFSFDP在保证算法的准确性及时间复杂度不改变的两项前提条件下,改进CFSFDP不能够自动确定聚类中心的缺点.相比DBSCAN、K-means、CFSFDP、CDP、fuzzy-CFSFDP,AU-TO-CFSFDP在F-measure和Accuracy两项....


图1Fuzzy-CFSFDP找出的中心点草图

图1Fuzzy-CFSFDP找出的中心点草图

在fuzzy-CFSFDP中提到当分别给出密度和距离的下限后找到的只是局部中心,需要进行二次聚类才可得到正确归类.二次聚类需要耗费更多的聚类时间,增加时间复杂度,不利于效率提升.图1Fuzzy-CFSFDP找出的中心点草图


图1Fuzzy-CFSFDP找出的中心点草图

图1Fuzzy-CFSFDP找出的中心点草图

图1Fuzzy-CFSFDP找出的中心点草图图1Fuzzy-CFSFDP找出的中心点草图


图1Fuzzy-CFSFDP找出的中心点草图

图1Fuzzy-CFSFDP找出的中心点草图

图1Fuzzy-CFSFDP找出的中心点草图如果不进行二次聚类,只是分别给密度和距离阈值选取密度大距离远的点为中心点,又会出现下列情况:当选取下限较低时会产生多个聚类中心,而当下限选取较高的时候会出现漏选密度和距离相对较高的中心点.



本文编号:3950307

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3950307.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户411e2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com