当前位置:主页 > 科技论文 > 软件论文 >

有效距离在聚类算法中的应用

发布时间:2018-11-18 20:28
【摘要】:聚类分析是数据挖掘领域的重要组成部分之一,而度量学习是聚类分析中的关键性步骤。传统聚类算法中通常使用欧氏距离进行距离度量,但是欧氏距离只关注两两样本之间的距离关系,并没有顾及数据的全局性分布结构。考虑到数据的全局性结构信息,提出了一种新的具有全局性的度量方法——有效距离度量(effective distance metric),其主要思想是通过稀疏重构的方法计算数据样本之间的有效距离。进一步地,将有效距离应用到K-means、K-medoids和FCM(fuzzy C-means)3种经典聚类算法中开发了3种基于有效距离的聚类算法,即EK-means,EK-medoids和EFCM聚类算法。通过与传统聚类算法在UCI标准数据集上的实验结果进行比较,验证了基于有效距离的聚类算法能显著提高聚类效果。
[Abstract]:Clustering analysis is an important part of data mining, and metric learning is a key step in clustering analysis. Euclidean distance is usually used for distance measurement in traditional clustering algorithms, but Euclidean distance only concerns the distance relationship between pairwise samples and does not take into account the global distribution structure of data. Considering the global structural information of data, a new global metric, effective distance metric (effective distance metric), is proposed. The main idea is to calculate the effective distance between data samples by sparse reconstruction. Furthermore, three effective distance based clustering algorithms, EK-means,EK-medoids and EFCM, are developed by applying effective distance to K-medoids and FCM (fuzzy C-means). Compared with the experimental results of the traditional clustering algorithm on the UCI standard data set, it is proved that the clustering algorithm based on the effective distance can improve the clustering effect significantly.
【作者单位】: 南京航空航天大学计算机科学与技术学院;泰山学院信息科学技术学院;
【基金】:国家自然科学基金Nos.61422204,61473149 南京航空航天大学研究生创新实验室开放基金No.kfjj20151605~~
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 李健森;白万民;;一种改进的距离度量的聚类算法[J];电子设计工程;2012年22期

2 李凡,饶勇,卢安;一种新的基于距离度量的近似推理方法[J];华中科技大学学报;2001年03期

3 吕清秀;李弼程;高毫林;;采用概率密度比值估计的距离度量学习[J];信号处理;2013年05期

4 邹朋成;王建东;杨国庆;张霞;王丽娜;;辅助信息自动生成的时间序列距离度量学习[J];软件学报;2013年11期

5 毛红保;冯卉;杨建华;刘亚军;;面向相似性查询的时间序列距离度量方法述评[J];计算机工程与设计;2010年19期

6 马永军,方凯,王定成,方廷健,陈卫;基于支持向量机和距离度量的管道内表面图像分类方法研究[J];数据采集与处理;2002年02期

7 兰远东;高蕾;;基于图的半监督学习的距离度量改进[J];智能计算机与应用;2014年02期

8 陈东成;朱明;贺柏根;杨文波;;特征压缩在线距离度量学习跟踪[J];光电子.激光;2014年08期

9 张亮;张凤鸣;杜纯;;复杂装备健康状态评估的粗糙核距离度量方法[J];计算机工程与设计;2009年18期

10 梁吉业;白亮;曹付元;;基于新的距离度量的K-Modes聚类算法[J];计算机研究与发展;2010年10期

相关博士学位论文 前4条

1 马连洋;跨摄像机行人再标识研究[D];上海交通大学;2014年

2 李超群;名词性属性距离度量问题及其应用研究[D];中国地质大学;2012年

3 江南;自适应距离度量及稳健视频运动分析[D];华中科技大学;2011年

4 郑小琪;生物分子数据的距离度量及其应用[D];大连理工大学;2009年

相关硕士学位论文 前10条

1 罗长春;基于三元组约束的距离度量学习方法研究[D];哈尔滨工业大学;2015年

2 陈琪;基于SIFT特征和距离度量学习的图像检索方法[D];电子科技大学;2015年

3 雷鹏;轨迹聚类中距离度量与聚类方法的研究[D];兰州大学;2015年

4 范顺国;MDP距离度量在强化学习迁移中的应用[D];南京大学;2014年

5 杨钰源;基于度量学习和深度学习的行人重识别研究[D];重庆大学;2016年

6 刘江涛;距离度量学习中的类别不平衡问题研究[D];东南大学;2016年

7 吕清秀;图像距离度量学习技术研究[D];解放军信息工程大学;2013年

8 陈巧娜;距离度量学习的理论与算法研究:核回归、大间隔最近邻与Fisher线性判别[D];华东师范大学;2010年

9 彭凯;基于距离度量学习的文本分类研究[D];上海交通大学;2013年

10 张磊;基于执行距离度量的软件调试与测试优化技术研究[D];南京航空航天大学;2013年



本文编号:2341126

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2341126.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f525b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com