当前位置:主页 > 科技论文 > 软件论文 >

基于流形距离和蜂群的聚类算法研究

发布时间:2019-11-30 22:53
【摘要】:现在的我们生活在数据时代,数据已经处在我们身边的每一处,且以爆炸式的的方式在增长,甚至已无法计算,那么如何从这么多数据中获取我们所需要的潜在有用得到知识,来帮住人们做出准确的判断,此时我们就有必要来挖掘这些数据。在数据挖掘中,比较重要的一种数据分析方式是聚类算法,其在研究领域十分受到研究者的青睐,但还是存在一些缺陷,这就需要更进一步的改进算法来弥补这些不足,且对解决社会实践中遇到的难点也具有非比寻常的价值。本文主要以传统聚类算法中的相似度测度为基础,探讨了以欧氏距离作为相似度测度对一些特殊数据集聚类时的不足,主要讨论了现已提出的基于流形距离为相似度测度对特殊数据集聚类的优势,当然也存在缺陷,在这里就更进一步研究了粗糙集、蜂群算法等的实质,并在此基础上作改进然后与改进的流形距离相结合,以改善原来算法的性能。主要工作如下:(1)针对K-means算法的初始聚类中心随机选取,将流形距离作为相似度测度时其参数在表现数据集的全局一致性方面有缺陷等问题,本文引入粒计算理论中的知识,对数据集的属性进行划分,随后根据最大最小距离的方法选取代表点;然后再利用流形距离及准则函数得到最佳的初始中心并得到最终聚类结果。实验结果表明:该算法在运行时间上减少了并在数据的全局一致性上得到了很好的体现。(2)现在提出的以流形距离为相似度测度的聚类算法主要是针对具有“绝对流形”分布特点的数据集聚类,没有考虑到这种分布为“相对流形”的数据集,于是本文根据粗糙集的特点,首先对数据集的属性进行划分然后根据最大最小距离来选择聚类中心,再在粗糙集中,用流形距离代替欧式距离对数据集进行聚类。实验结果表明:该算法对“相对流形”数据集具有较大的改善。(3)为改进原有的基于流形距离的聚类算法性能,本文将改进的流形距离作为相似度测度,并结合人工蜂群算法,对数据集进行二阶段聚类。算法首先由局部密度、近邻选择等对数据集粗归类,然后通过改进的蜂群算法对数据集精归类。实验结果表明:数据集聚类效果得到很大的提升。
【学位授予单位】:长沙理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 于谦;高阳;霍静;庄韫恺;;视频人脸识别中判别性联合多流形分析[J];软件学报;2015年11期

2 大西克也;;奻姫“流形”原意[J];出土文献;2010年00期

3 米雅薇;;n个流形的积流形的证明[J];吉林化工学院学报;2018年03期

4 刘艳丽;张建朋;;基于密度峰值搜索的改进流形聚类算法[J];计算机工程与设计;2016年06期

5 朱小飞;郭嘉丰;程学旗;杜攀;;基于流形排序的查询推荐方法[J];中文信息学报;2011年02期

6 冯晓华;高策;;弦理论与卡-丘流形的结合[J];科学技术哲学研究;2011年04期

7 林远华;;中心流形的特点与近似求法[J];科技信息;2011年17期

8 刘波;张鸿宾;;一种基于边界约束的流形展开方法[J];自动化学报;2010年04期

9 王宝勤;张福娥;赵晓华;;关于L流形的一些讨论[J];数学进展;2009年03期

10 张士诚;孙华飞;李春晖;;指数统计流形性质和应用[J];徐州师范大学学报(自然科学版);2009年04期

相关会议论文 前10条

1 黄涛;张国新;;岩爆的流形元法模拟研究[A];北京力学会第13届学术年会论文集[C];2007年

2 付士慧;陆启韶;;蔡电路平衡点和平衡流形的稳定性及其分岔的研究[A];第九届全国动力学与控制学术会议会议手册[C];2012年

3 董亚丽;;基于中心流形设计的非线性系统的镇定[A];第二十三届中国控制会议论文集(上册)[C];2004年

4 张家忠;陈丽莺;梅冠华;周志宏;苏哲;;基于时滞惯性流形的浅拱动力屈曲研究[A];第八届全国动力学与控制学术会议论文集[C];2008年

5 焦振华;邓琴;;关于非负曲率凯勒流形单值化定理的一个注记[A];数学·力学·物理学·高新技术交叉研究进展——2010(13)卷[C];2010年

6 张国新;;数值流形法及工程应用[A];中国力学学会学术大会'2005论文摘要集(上)[C];2005年

7 林绍忠;苏海东;;数值流形法中独立覆盖区域的一种自动选取方法[A];中国力学大会——2013论文摘要集[C];2013年

8 苏海东;谢小玲;;在欧拉描述下用数值流形法分析结构大变形[A];中国力学学会学术大会'2005论文摘要集(下)[C];2005年

9 谌龙;王德石;;非线性控制系统不可控子空间的中心流形镇定方法[A];数学·力学·物理学·高新技术研究进展——2004(10)卷——中国数学力学物理学高新技术交叉研究会第10届学术研讨会论文集[C];2004年

10 林绍忠;祁勇峰;苏海东;;基于矩阵特殊运算的高阶流形元矩阵公式及快速单纯形积分[A];中国力学学会学术大会'2005论文摘要集(下)[C];2005年

相关重要报纸文章 前9条

1 夏文燕;河海大学成立世界首个“数值流形研究中心”[N];江苏科技报;2010年

2 复旦大学出土文献与古文字研究中心 裘锡圭;古书中与重文有关的误文[N];社会科学报;2009年

3 陈集亮;杂然赋流形[N];常德日报;2012年

4 本报记者 杨兴;让传统照进未来[N];中国艺术报;2011年

5 责任编辑 黄采群 本报记者 竺大文 实习生 邵金蔚;他们在设计中寻找东方文化的灵感[N];浙江日报;2006年

6 本报记者 成长;鼎足三分梦 杂然赋流形[N];中国文化报;2010年

7 余杭记者站 费云江 沈维;文创产业成为经济发展的有力引擎[N];杭州日报;2012年

8 吴孟婕 王幸泽;用现代设计复活传统纸伞工艺[N];农民日报;2013年

9 演讲人 刘克峰;物理激发的数学[N];光明日报;2011年

相关博士学位论文 前10条

1 林木;含平衡流形系统的正规形及应用问题[D];清华大学;2009年

2 王力;基于流形的线性结构探测及目标识别方法研究[D];东北大学;2012年

3 黄腾;关于四维流形中的Kapustin-Witten方程的一些分析性质[D];中国科学技术大学;2016年

4 薛昌涛;四维流形上的循环群作用[D];大连理工大学;2011年

5 黄东;基于流形的降维方法及其在计算机视觉中的应用[D];电子科技大学;2009年

6 刘向阳;多流形数据建模及其应用[D];上海交通大学;2011年

7 曾伟;数值流形法的改进及其在土石坝分析中的应用[D];大连理工大学;2014年

8 李春辉;统计流形和矩阵流形上的几何结构及其应用[D];北京理工大学;2014年

9 戴敏;流形间有界失真映射和调和映射的研究[D];浙江大学;2009年

10 丁晓喜;机械状态流形特征增强理论及监测诊断方法研究[D];中国科学技术大学;2017年

相关硕士学位论文 前10条

1 欧慧;基于流形距离和蜂群的聚类算法研究[D];长沙理工大学;2016年

2 张汉超;流形上的稀疏编码[D];华东师范大学;2015年

3 刘智;流形上的共形变换[D];山西师范大学;2014年

4 刘明辉;3维流形的融合积中不可压缩曲面的一个研究[D];大连理工大学;2007年

5 张昕;流形对齐中若干问题研究[D];华侨大学;2015年

6 何金花;两线性流形之间距离的算法研究[D];福建师范大学;2012年

7 徐猛;基于关联性挖掘的流形对齐算法研究[D];华侨大学;2016年

8 王巧丽;多流形的人脸特征提取与识别研究[D];南昌航空大学;2016年

9 王文昌;数值流形法的前后处理与并行计算方法研究[D];长江科学院;2011年

10 李义;基于独立覆盖数值流形法的大体积混凝土温度场仿真计算[D];长江科学院;2015年



本文编号:2568097

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2568097.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5add2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com