当前位置:主页 > 理工论文 > 生物学论文 >

基于动态组织膜系统的谱聚类集成算法研究与应用

发布时间:2020-04-11 03:16
【摘要】:随着信息时代到来,数据量激增,数据复杂度高,如何从这些数据中挖掘有用信息正成为数据挖掘的一个重要研究方向。聚类研究是数据挖掘的一个主要方法,是一种有效分析数据、挖掘有效信息的方式。传统的聚类算法如k均值算法、k中心点算法等在处理日渐复杂的数据时显得力不从心。谱聚类是一种建立在图论基础上的新型聚类算法,近年来谱聚类算法因其具有坚实的理论基础和优异的聚类效果吸引了越来越多的学者对其进行研究。但是只采用一种聚类算法通常无法处理各类异构数据集和计算过程中面对的问题。聚类集成的思路是通过一定的方式整合多个学习器产生的基聚类以产生新的聚类结果,因其结合了学习器的差异性和精确性,所以集成算法泛化能力强,生成聚类结果更优。膜计算是仿照生物细胞膜工作机制提出的一种高效、新颖的计算模型,它涉及计算科学与生命科学两大领域,是一门综合学科。本文主要对谱聚类算法、谱聚类集成算法以及膜计算进行了研究,具体研究内容如下:首先,介绍了本文涉及到的膜计算、谱聚类算法、聚类集成算法的研究现状及国内外研究趋势。细胞型膜系统、组织型膜系统和神经型膜系统三种膜计算模型的结构、规则;图划分准则、谱聚类概述;聚类集成算法原理、学习器合并策略以及各自研究应用和本文的创新的与难点。其次,本文提出两种新型组织型膜系统—动态组织膜系统(Dynamic Tissue-like Membrane System,简称DTP系统)和混合型动态组织膜系统(Hybrid Dynamic Tissue-like Membrane System,简称HDTP系统)。前者可以根据输入数据调用膜内规则动态调整结构,实现自动聚类;后者在DTP系统基础上将组织型膜系统与细胞型膜系统结合,使之成为适合聚类集成算法的结构。同时利用寄存器证明了DTP系统和HDTP系统的图灵可计算性。然后,提出两种基于膜系统的聚类算法。第三章提出基于动态组织膜系统的改进谱聚类算法(Improved Spectral Clustering Algorithm,简称为ISC算法),将基本谱聚类算法中用到的K-means算法初始点的选取方法进行了优化,使K-means算法不易受初始聚类中心和离群点的影响提高算法准确性,并将改进算法与膜系统结合,用实验证明改进算法在聚类准确性和处理球面数据集方面的优越性。第四章以ISC算法为学习器,利用Bagging技术和选择性集成策略设计了基于Bagging技术的改进谱聚类选择性聚类集成算法(Improved Spectral Clustering Selective Clustering Ensemble Algorithm Based on Bagging Technology,简称为ISCBE算法),再将此算法与HDTP系统结合,利用其并行计算优势提高算法有效性。本章将HDTP-ISCBE算法与DTP-ISC算法、谱聚类算法及K-means算法进行比较,在UCI数据集上显示出较好的聚类效果。最后,本文将提出的HDTP-ISCBE算法应用到微博用户和小红书用户细分研究中,用网络爬虫软件分别爬取两个平台用户数据,对数据进行清洗、编码、特征选择等一系列操作后利用HDTP-ISCBE算法对数据进行聚类,以聚类效果衡量算法效率,从实际意义方面分析细分后用户类型的特征,以此为依据为企业针对不同类型微博用户设计营销方案提出意见与建议。
【图文】:

聚类过程


图 1-1 谱聚类过程为了将数据划分到 k ( k 2)个簇,目前主要有 2-路划分和多路划分两种划分方法划分每次使用相同的算法将图划分为两个部分,直到得到的簇数满足要求。这种起来简单易懂,但是运行效率低,,只是用单一特征向量(如 Fiedler 向量)包含的

学习器,构造机制


学习器构造机制
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP311.13;Q811.4

【相似文献】

相关期刊论文 前10条

1 黄良韬;赵亚群;;双图约束谱聚类中的数据不相似图构造[J];信息工程大学学报;2017年05期

2 曲昊;闵洁;;利用谱聚类发现符号化时间序列中的模式[J];九江职业技术学院学报;2017年02期

3 唐风琴;丁文文;;基于谱聚类带有节点特征的社区发现算法[J];中国科学技术大学学报;2018年02期

4 吴彦博;;谱聚类广义模型和典型算法探析[J];通讯世界;2016年23期

5 张晓琴;安晓丹;曹付元;;基于谱聚类的二分网络社区发现算法[J];计算机科学;2019年04期

6 王俊洁;刘青;;基于谱聚类的自适应新生目标强度状态提取[J];计算机工程与设计;2019年03期

7 叶茂;刘文芬;;一种适用于大规模数据的约束谱聚类框架[J];信息工程大学学报;2018年04期

8 宋以宁;刘文萍;骆有庆;宗世祥;;基于线性谱聚类的林地图像中枯死树监测[J];林业科学;2019年04期

9 房梁;殷丽华;李凤华;方滨兴;;基于谱聚类的访问控制异常权限配置挖掘机制[J];通信学报;2017年12期

10 徐雪丽;苏锦霞;;稀疏谱聚类方法及应用[J];兰州大学学报(自然科学版);2017年05期

相关会议论文 前8条

1 刘世伟;;基于谱聚类的通信行业原生家庭识别模型研究[A];2018广东通信青年论坛优秀论文专刊[C];2018年

2 王忠美;顾行发;杨晓梅;;基于边界指导光谱聚类高分辨遥感图像分割[A];第四届高分辨率对地观测学术年会论文集[C];2017年

3 张鲁民;贾焰;周斌;;基于情感计算的微博突发事件检测方法研究[A];第27次全国计算机安全学术交流会论文集[C];2012年

4 谢永康;周雅倩;黄萱菁;;一种基于谱聚类的共指消解方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

5 陈昆;李跃华;;基于谱聚类的非线性降维算法研究[A];第十一届全国博士生学术年会——信息技术与安全专题论文集[C];2013年

6 张月;邹焕新;邵宁远;秦先祥;周石琳;计科峰;;类别数目自动估计的极化SAR图像非监督地物分类[A];第四届高分辨率对地观测学术年会论文集[C];2017年

7 赵占飞;梁伟;;天然气压缩机故障信号聚类方法研究[A];2015年中国机械工程学会设备与维修工程分会学术年会论文集[C];2015年

8 黄春燕;张目;李岩;席春红;;基于谱聚类的科技型中小企业信用风险评价研究[A];风险分析和危机反应中的信息技术--中国灾害防御协会风险分析专业委员会第六届年会论文集[C];2014年

相关博士学位论文 前10条

1 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年

2 隋毅;基于谱聚类的图像分割方法研究[D];哈尔滨工程大学;2013年

3 陈丽敏;面向大规模数据集的谱聚类方法研究[D];哈尔滨工程大学;2015年

4 苏木亚;谱聚类方法研究及其在金融时间序列数据挖掘中的应用[D];大连理工大学;2011年

5 杨艺芳;谱聚类与维数约简算法及其应用[D];西安电子科技大学;2016年

6 鲁斌;几类复杂网络度量性质和拓扑性质的研究[D];华南理工大学;2013年

7 宋军;水交换模型的理论方法及应用研究[D];中国海洋大学;2010年

8 樊沛;虚拟计算环境中面向通信特征的应用部署优化技术研究[D];国防科学技术大学;2012年

9 陈伟;高光谱影像地物智能化提取理论与方法研究[D];解放军信息工程大学;2012年

10 谷瑞军;基于流形学习的高维空间分类器研究[D];江南大学;2008年

相关硕士学位论文 前10条

1 胡雪伟;基于动态组织膜系统的谱聚类集成算法研究与应用[D];山东师范大学;2019年

2 杨阳;基于谱聚类的复杂网络重叠社团检测算法研究[D];安徽大学;2019年

3 王若南;基于密度的增量数据谱聚类方法研究[D];哈尔滨工程大学;2019年

4 谢雪峰;基于收缩谱聚类方法的推荐算法研究[D];兰州大学;2019年

5 马扬;基于谱聚类的复杂网络时序链路预测技术研究[D];国防科学技术大学;2016年

6 骆迅;基于LMDI和高斯图模型的中国雾霾成因实证研究[D];华中师范大学;2018年

7 崔宇童;基于谱聚类优化的社区发现方法研究[D];中国矿业大学;2018年

8 王益新;基于谱聚类的数据挖掘方法研究[D];西安电子科技大学;2018年

9 谷金超;基于谱聚类方法的基因表达数据分析研究[D];湖南大学;2016年

10 陈方;基因表达数据的谱聚类方法研究[D];湖南大学;2015年



本文编号:2623075

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2623075.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户03f80***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com