当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于群体智能优化的聚类算法研究

发布时间:2021-11-07 11:45
  伴随计算机计算能力、存储能力的大幅提升和移动互联网规模的飞速发展,电子商务、社交媒体、信息科技等领域每时每刻都会产生大量的海量数据。如何从复杂、稀疏的海量数据中高效的挖掘有用的隐含信息成为“人工智能”背景下社会发展进步的迫切需求。聚类分析作为数据挖掘领域中一类经典的无监督学习方法,可以在缺乏训练样本的情况下,找出数据间潜在的结构关系,在现有实际数据大多缺乏标记的背景下,具有无监督学习能力的聚类分析技术已然成为人工智能领域的研究热点之一。由于无监督学习的特性,现阶段多数聚类算法都需要人工设置关键参数,在面对高维、复杂数据,人工难以寻找合适的全局参数,因此在大数据环境下找到合适的全局参数就成为提高聚类分析算法性能的关键问题。本文以此类问题为出发点,利用群体智能算法效率高、收敛快的寻优特点,对果蝇优化算法和布谷鸟搜索算法进行改进,提升算法寻优能力和效率,并将其应用于解决近邻传播算法参数优化问题,从而形成新的聚类分析模型。本文的主要内容和创新如下:(1)针对传统果蝇优化算法全局搜索能力不足、易于早熟的问题,提出基于知识记忆的果蝇优化算法(KM-FOA),算法加入个体知识记忆机制。知识记忆机制中... 

【文章来源】:长春工业大学吉林省

【文章页数】:91 页

【学位级别】:硕士

【部分图文】:

基于群体智能优化的聚类算法研究


群体智能算法分类图

示意图,消息传递,算法,示意图


图 2.4AP 算法消息传递示意图2.2.3 聚类有效性评价指标与一些有监督的机器学习方法不同,聚类分析由于缺乏标记数据,无法衡量划分的合理性,因此合理构建一种评价聚类质量的准则函数(聚类评价指标)成为聚类算法研究的另一研究方向[29]。根据评价原理和方式的区别,现阶段常用的聚类评价指标大致分为两类,分别是内部评价指标和外部评价指标。内部评价主要对类簇间分离程度和紧凑度进行评价[30];外部评价指标适用于数据类别标签已知的情况,通过一些统计学方法衡量算法聚类准确率[31]。根据以上分析和本文所用数据类型,选取 Silhouette指标(内部评价指标)和 F-measure 指标(外部评价指标)作为全文聚类评价指标。(1)Silhouette 指标假设具有 N 个样本点的数据集 D 可以被分成 k 个类簇 Ci(i = 1,2,k)。对于每个类簇,Silhouette 指标计算如公式 2-15 所示。 11max ,inmib m a mSil in b m a m (2-15)

路线图,路线图,算法流程,目标函数


.1.3 算法流程KM-FOA 算法的具体流程如表 3-1 所示。表 3-1 KM-FOA 算法流程入:目标函数 f(x) ,最大迭代次数 maxgen ,果蝇种群规模 sizepop ,目标函数维度 n。出:最优目标函数值 Smelli骤 1:算法初始化。初始化算法参数(sizepop, maxgen, n)和个体初始位置。1 2 3'( , , , )( )j jnj jLB UB LB randX L骤 2:嗅觉搜索阶段。 通过公式 3-1、3-2 和 3-3 计算方向向量,并计算个体食物味道浓度。( y ) , then ( y )( y ) , then ( y )ij ij j ij j ij jij ij j ij j ij jIf x or UB x UB or UBIf x or LB x LB or LB 骤 3:视觉觅食阶段。通过公式 3-4 进行全局视觉搜索。(X , Y ) arg(min (S ))best best if 图 3.2 KM-FOA 和 FOA 的搜索路线图(左边为 KM-FOA,右边为 FOA)

【参考文献】:
期刊论文
[1]基于奇异值分解的自适应近邻传播聚类算法[J]. 王丽敏,姬强,韩旭明,黄娜.  吉林大学学报(理学版). 2014(04)
[2]逐维改进的布谷鸟搜索算法[J]. 王李进,尹义龙,钟一文.  软件学报. 2013(11)
[3]随机变异差分进化算法[J]. 欧阳海滨,高立群,孔祥勇.  东北大学学报(自然科学版). 2013(03)
[4]一种分层组合的半监督近邻传播聚类算法[J]. 张震,汪斌强,伊鹏,兰巨龙.  电子与信息学报. 2013(03)
[5]基于免疫粒子群算法的PID参数整定与自适应[J]. 邓丽,蒋婧,费敏锐.  自动化仪表. 2013(02)
[6]AP算法在图像聚类中的应用研究[J]. 杨传慧,吉根林,章志刚.  计算机与数字工程. 2012(10)
[7]应用果蝇优化算法优化广义回归神经网络进行企业经营绩效评估[J]. 潘文超.  太原理工大学学报(社会科学版). 2011(04)
[8]一种结合半监督的改进自适应亲和传播聚类[J]. 王磊,汪西莉,刘高霞,赵琳.  计算机应用研究. 2010(12)
[9]聚类趋势问题的研究综述[J]. 褚娜,马利庄,王彦.  计算机应用研究. 2009(03)
[10]进化多目标优化算法研究[J]. 公茂果,焦李成,杨咚咚,马文萍.  软件学报. 2009(02)

博士论文
[1]基于群智能优化理论的聚类改进方法及应用研究[D]. 周瑞红.吉林大学 2017

硕士论文
[1]基于群体智能聚类研究及其在股市板块分析中的应用[D]. 邱兵.长春工业大学 2017
[2]面向复杂结构数据的近邻传播聚类算法研究[D]. 姬强.吉林财经大学 2016
[3]遗传算法的研究与应用[D]. 王银年.江南大学 2009



本文编号:3481801

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3481801.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户38157***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com