面向复杂结构数据的近邻传播聚类算法研究
本文关键词:面向复杂结构数据的近邻传播聚类算法研究
更多相关文章: 近邻传播聚类算法 奇异值分解 烟花爆炸优化算法 低秩表示 结构相似度 半监督学习 果蝇优化
【摘要】:随着大数据库的建立和海量数据的不断涌现,数据挖掘技术越来越受到众多领域的广泛关注。聚类技术作为数据挖掘的重要分支,通过无监督学习,从海量数据中找出数据潜在的内部结构,已然成为人工智能领域的研究热点。近邻传播聚类算法(Affinity Propagation,AP)作为无监督学习领域极具竞争力的聚类技术,迄今为止已得到各领域广泛认可。尽管如此,AP算法仍然存在不足之处:(1)只能处理聚类结构清晰的超球形数据聚类问题,面对结构复杂的数据聚类效果不佳;(2)欧式距离无法准确反映高维数据间的相似性(3)AP算法的参数需要手动调节,增加算法的使用成本。鉴于上述问题,本文以构建相似性度量和相关参数优化为突破口,分别针对不同问题提出不同的改进方案:(1)针对近邻传播聚类算法难以处理高维数据的聚类问题,提出基于奇异值分解的自适应近邻传播聚类算法(Self-adapting affinity propagation clustering algorithm based on singular value decomposition,SVD-SAP)。该算法通过对高维数据进行奇异值分解,消除数据的冗余维度,采用非线性函数策略调整阻尼系数,提高算法的聚类性能。(2)针对近邻传播聚类算法的偏向参数无法合理地确定,提出基于烟花爆炸优化的半监督近邻传播聚类算法(Semi-supervised affinity propagation based on fireworks explosion optimization,FEO-SAP)。该算法利用成对约束信息调整相似度矩阵,并在算法迭代过程中引入烟花爆炸的思想,双向搜索偏向参数空间以获得最佳聚类结构。(3)为同步优化偏向参数和阻尼因子,提出基于果蝇优化的自适应近邻传播聚类算法(Self-adaptive affinity propagation based on fruit fly optimization algorithm,FOA-SAP)。利用果蝇优化算法的全局寻优能力,同时寻优偏向参数和阻尼因子两个参数空间,并根据Silhouette有效性指标确定最佳聚类。(4)鉴于近邻传播聚类算法难以处理具有复杂结构的数据集,提出基于结构相似度的半监督自适应近邻传播聚类算法(Semi-supervised adaptive affinity propagation clustering algorithm based on structural similarity,SAAP-SS)。该算法通过求解一个核低秩表示的优化问题,发现数据潜在流形结构,并利用烟花算法双向搜索偏向参数,从而获得最佳聚类结果。
【关键词】:近邻传播聚类算法 奇异值分解 烟花爆炸优化算法 低秩表示 结构相似度 半监督学习 果蝇优化
【学位授予单位】:吉林财经大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-10
- 第1章 绪论10-16
- 1.1 选题背景与研究意义10-11
- 1.2 国内外研究现状11-13
- 1.3 主要研究内容和组织结构13-15
- 1.3.1 主要研究内容13-14
- 1.3.2 本文组织结构14-15
- 1.4 本文主要创新点15-16
- 第2章 聚类算法的理论基础16-26
- 2.1 相似性度量方式16-17
- 2.2 聚类算法分类17-22
- 2.2.1 基于划分的方法18
- 2.2.2 基于层次的方法18-19
- 2.2.3 基于密度的方法19-21
- 2.2.4 基于模型的方法21
- 2.2.5 基于网格的方法21-22
- 2.3 近邻传播聚类算法22-23
- 2.4 聚类有效性评价指标23-26
- 第3章 基于奇异值分解的自适应近邻传播聚类算法26-33
- 3.1 基于奇异值分解的自适应近邻传播聚类算法26-28
- 3.1.1 奇异值分解26
- 3.1.2 基于奇异值分解的降维过程26-27
- 3.1.3 动态阻尼因子策略27-28
- 3.1.4 SVD-SAP算法流程28
- 3.2 仿真实验与分析28-30
- 3.2.1 实验数据28-29
- 3.2.2 实验结果与分析29-30
- 3.3 SVD-SAP聚类算法在股市板块的应用30-32
- 3.3.1 数据选取30-31
- 3.3.2 聚类结果及分析31-32
- 3.4 本章小结32-33
- 第4章 基于烟花爆炸优化的半监督近邻传播聚类算法33-40
- 4.1 烟花爆炸优化算法33-36
- 4.1.1 算法思想33
- 4.1.2 算法描述33-35
- 4.1.3 半监督约束规则35-36
- 4.1.4 FEO-SAP算法流程36
- 4.2 仿真实验与分析36-39
- 4.2.1 实验数据36-37
- 4.2.2 实验结果与分析37-39
- 4.3 本章小结39-40
- 第5章 基于果蝇优化的自适应近邻传播聚类算法40-44
- 5.1 基于果蝇优化的近邻传播聚类算法40-41
- 5.1.1 果蝇优化算法40-41
- 5.1.2 FOA-SAP算法流程41
- 5.2 仿真实验与分析41-43
- 5.2.1 实验数据41-42
- 5.2.2 实验结果与分析42-43
- 5.3 本章小结43-44
- 第6章 基于结构相似度的半监督自适应近邻传播聚类算法44-51
- 6.1 结构相似性度量44-46
- 6.1.1 数据低秩转换44-45
- 6.1.2 结构相似度的核设计45-46
- 6.1.3 算法流程46
- 6.2 仿真实验与分析46-50
- 6.2.1 实验数据46-47
- 6.2.2 实验结果与分析47-50
- 6.3 本章小结50-51
- 第7章 总结与展望51-53
- 参考文献53-57
- 攻读硕士学位期间已公开发表的论文57-58
- 致谢58
【相似文献】
中国期刊全文数据库 前10条
1 葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期
2 骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期
3 李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期
4 刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期
5 林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期
6 章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期
7 杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期
8 周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期
9 吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期
10 王贵竹;一种产生单向分解值的算法[J];安徽大学学报(自然科学版);2001年03期
中国重要会议论文全文数据库 前10条
1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年
2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年
3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年
5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国重要报纸全文数据库 前1条
1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年
中国博士学位论文全文数据库 前10条
1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年
2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年
4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年
5 王洋;基于群体智能的通信网络告警关联规则挖掘算法研究[D];太原理工大学;2015年
6 雷雨;面向考试时间表问题的启发式进化算法研究[D];西安电子科技大学;2015年
7 熊霖;大数据下的数据选择与学习算法研究[D];西安电子科技大学;2015年
8 周雷;基于图结构的目标检测与分割算法研究[D];上海交通大学;2014年
9 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年
10 蒋亦樟;多视角和迁移学习识别方法和智能建模研究[D];江南大学;2015年
中国硕士学位论文全文数据库 前10条
1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年
2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年
3 李家昌;基于能量约束的超声图像自动分割算法[D];华南理工大学;2015年
4 陈坚;基于密度和约束的数据流聚类算法研究[D];兰州大学;2015年
5 高健;基于Zynq7000平台的去雾算法研究及实现[D];南京理工大学;2015年
6 顾磊;基于Hadoop的聚类算法的数据优化及其应用研究[D];南京信息工程大学;2015年
7 杨燕霞;基于Hadoop平台的并行关联规则挖掘算法研究[D];四川师范大学;2015年
8 王羽;基于MapReduce的社区发现算法的设计与实现[D];南京理工大学;2015年
9 许振佳;流式数据的并行聚类算法研究[D];曲阜师范大学;2015年
10 董琴;人工蜂群算法的改进与应用[D];大连海事大学;2015年
,本文编号:684761
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/684761.html