粒子对与和声搜索混合算法在基因聚类的应用研究
本文关键词:粒子对与和声搜索混合算法在基因聚类的应用研究
更多相关文章: 微阵列 基因聚类 粒子对算法 和声算法 信息熵
【摘要】:随着生命科学研究的不断深入,人类对于生命起源,物种进化等领域的探索受到越来越多学者的关注。面对繁绪复杂的数据分析,统计和运算,使得集成生物科学,数学计算,计算机科学,化学分析研究等领域于一体的生物信息学应运而生。这也标志着人类基因组计划已步入后基因组时代。在后基因组时代,关于基因组研究的重点也由基因组测序转变为:确定生物体中每条基因在生命过程中所起到的功能,以及不同基因之间相互协调和相互引导的关系上。由于研究重点的转变,传统的实验技术和实验方法对于海量基因组序列数据的处理显得越来越乏力。随着人工智能的迅猛发展和生命科学的兴旺,人们迫切需要寻求更为高效便捷的基因表达处理方法。而要揭示生命科学的本源,就要对海量基因组进行精确测序和统计分析,微阵列技术在这种研究背景下应运而生。微阵列(microarray)技术,常被称为芯片技术,是由“人类基因组计划”的发展而兴起的一项新技术,广泛应用于基因序列分析、基因突变检测和多态性分析以及疾病的基因诊断等诸多领域。聚类分析是微阵列数据分析中广泛使用的方法之一,具有较高的研究价值。原有的聚类算法虽然顺利的攻克了低维,数据量小的聚类难关。但由于规模和交互程度的不断扩张,以及分析探索的不断深入,现有的算法通常不能取得理想的聚类效果,也很难满足人们对于数据分析效率和准确性的要求。随着人们对算法效率的要求不断攀升,群智能算法的兴起(如遗传算法、粒子群优化算法(PSO)、粒子对算法、免疫算法、人工蜂群算法等)为数据分析提供了新方向。群智能算法具有模拟生物群体进化学习的特性,在解决复杂优化问题方面显示出了其独有的优势,已在社会科学、自然科学、经济管理学、医学、生物学、计算机等众多领域得到了成功的应用。基因表达数据聚类算法的研究还处在不断研究和探索中,作为目前比较新颖的基因聚类算法——粒子对算法(PPO),具有群体规模小,便于协调粒子之间的位置关系,能获得较好的聚类效果等优势,是目前广泛使用且效果较好的基因聚类算法之一。但同样PPO算法也存在着过早陷入局部最优、全局搜索能力不强等缺点,针对PPO算法的这些不足,本文建议了一种新的基于PPO优化算法与和声算法(HS)的混合算法(DPPO-HS)。在算法初代形成精英粒子对的迭代过程中,引入PSO算法对其中一个精英粒子进行一次快速初始化,而另外一个精英粒子则沿用标准PPO聚类算法进行初始化,通过将两个不同初始化的粒子组成精英粒子对,增强了精英粒子对间的交流学习能力,在一定程度上改善了精英粒子对的解质量和搜优能力。混合算法在获得精英粒子对后,针对PPO算法易陷入局部最优解的不足,在第二阶段的迭代过程中,尝试引入以信息熵动态调整HS算法微调概率的和声优化算法,提高混合算法的全局搜索能力和跳出局部最优区域的能力。在此思路的基础上,通过四组不同的国际通用标准基因表达数据集,以MSE均方差函数,D1类内紧致度,D2类间分离度为检测指标,将本文的混合算法DPPO-HS与当前较为流行K-Means算法,标准PPO粒子对聚类算法,DPPO算法,以及聚类效果较好的PPO-DE混合算法做了详尽的实验对比分析,将五种算法通过四组不同数据集的三项检测指标,进行了较为详尽的对比试验。实验结果表明,本文的混合算法DPPO-HS与其他四种对比算法相比,取得了较好的聚类精度、类内紧致度和类间分离度,证明本文提出的混合算法是有效的。
【关键词】:微阵列 基因聚类 粒子对算法 和声算法 信息熵
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q811.4;TP311.13
【目录】:
- 摘要3-5
- Abstract5-9
- 第1章 绪论9-14
- 1.1 本文的研究背景及其意义9-10
- 1.2 基因聚类分析的研究现状10-12
- 1.3 本文主要研究工作12
- 1.4 本文的组织结构12-13
- 1.5 本章小结13-14
- 第2章 基因聚类分析研究14-18
- 2.1 生物信息学简介14
- 2.2 基因表达数据聚类分析14-17
- 2.2.1 基因表达数据表示14-15
- 2.2.2 数据预处理15-16
- 2.2.3 基因聚类结果评价16-17
- 2.3 基因表达数据集17
- 2.4 本章小结17-18
- 第3章 基因聚类算法分析18-25
- 3.1 K-means算法18-19
- 3.2 粒子群聚类算法19-21
- 3.3 粒子对算法21-24
- 3.3.1 粒子对算法基本原理21-22
- 3.3.2 粒子对算法步骤流程22-24
- 3.4 本章小结24-25
- 第4章 信息熵及和声算法分析研究25-31
- 4.1 信息熵25-26
- 4.1.1 信息熵原理25-26
- 4.2 和声搜索算法26-30
- 4.2.1 和声算法基础26-27
- 4.2.2 和声搜索算法模型27-29
- 4.2.3 和声搜索算法的应用29-30
- 4.3 本章小结30-31
- 第5章 粒子对优化算法基因聚类研究31-41
- 5.1 算法优化的可行性分析31-32
- 5.1.1 粒子对算法有待解决的不足31-32
- 5.2 改进的粒子对算法研究32-39
- 5.2.1 对初始粒子质量进行优化32-36
- 5.2.2 改进算法对初始粒子聚类的研究36-39
- 5.3 实验结果分析及讨论39-40
- 5.4 本章小结40-41
- 第6章 混合算法DPPO-HS41-54
- 6.1 改进的粒子对与和声混合算法DPPO-HS思路41-42
- 6.2 混合算法DPPO-HS算法具体流程42-45
- 6.3 实验结果对比及分析45-52
- 6.3.1 实验数据集及参数设置45-46
- 6.3.2 实验结果分析46-52
- 6.4 本章小结52-54
- 第7章 总结与展望54-56
- 参考文献56-59
- 致谢59-60
【相似文献】
中国期刊全文数据库 前10条
1 胡洪林;;截断思想在算法分析中的应用[J];科技风;2012年12期
2 陈际平;算法分析与优化程序的研究[J];西北大学学报(自然科学版);1994年05期
3 梁彦杰;徐坚;;算法分析中概率变化与图形生成[J];云南大学学报(自然科学版);2009年S2期
4 刘宁;邵晓艳;;算法分析与设计课程中多媒体技术的应用[J];科技风;2009年18期
5 海亚;张永平;;算法对学生解决问题能力的培养[J];黑龙江科技信息;2008年10期
6 李冰颖,夏利民,舒远仲;学分制模式下网上选课系统的算法探析[J];江西科学;2004年05期
7 Anany Levitin;Maria Levitin;;算法谜题[J];中国科技信息;2014年08期
8 杜刚;陆黎明;;一修路问题的算法解决分析[J];太原师范学院学报(自然科学版);2006年02期
9 许之民;;砝码称重问题的多种算法分析与探究[J];合肥学院学报(自然科学版);2011年01期
10 李亚楠;;菌群优化算法分析[J];贵州大学学报(自然科学版);2011年02期
中国重要会议论文全文数据库 前10条
1 俞洋;田亚菲;;一种新的变步长LMS算法及其仿真[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
2 周颢;刘振华;赵保华;;构造型的D~2FA生成算法[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
3 赖桃桃;冯少荣;张东站;;一种基于划分和密度的快速聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 刘远新;邓飞其;罗艳辉;舒添慧;;ERP柔性平台下物流运输配送系统算法分析[A];第二十六届中国控制会议论文集[C];2007年
5 王树西;白硕;姜吉发;;模式合一的“减首去尾”算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 王万青;张晓辉;;改进的A~*算法的高效实现[A];2009全国测绘科技信息交流会暨首届测绘博客征文颁奖论文集[C];2009年
7 孙焕良;邱菲;刘俊岭;朱叶丽;;IncSNN——一种基于密度的增量聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 韩建民;岑婷婷;于娟;;实现敏感属性l-多样性的l-MDAV算法[A];第二十七届中国控制会议论文集[C];2008年
9 张悦;尤枫;赵瑞莲;;利用蚁群算法实现基于程序结构的主变元分析[A];第五届中国测试学术会议论文集[C];2008年
10 王旭东;刘渝;邓振淼;;正弦波频率估计的修正Rife算法及其FPGA实现[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年
中国重要报纸全文数据库 前1条
1 科文;VIXD算法分析Web异常[N];中国计算机报;2008年
中国博士学位论文全文数据库 前10条
1 魏哲学;样本断点距离问题的算法与复杂性研究[D];山东大学;2015年
2 刘春明;基于增强学习和车辆动力学的高速公路自主驾驶研究[D];国防科学技术大学;2014年
3 张敏霞;生物地理学优化算法及其在应急交通规划中的应用研究[D];浙江工业大学;2015年
4 李红;流程挖掘算法研究[D];云南大学;2015年
5 盛歆漪;粒子群优化算法及其应用研究[D];江南大学;2015年
6 黄磊;高动态环境捷联惯导信号处理及高精度姿态速度算法研究[D];南京航空航天大学;2015年
7 刘新旺;多核学习算法研究[D];国防科学技术大学;2013年
8 于滨;城市公交系统模型与算法研究[D];大连理工大学;2006年
9 曾国强;改进的极值优化算法及其在组合优化问题中的应用研究[D];浙江大学;2011年
10 肖永豪;蜂群算法及在图像处理中的应用研究[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄厦;基于改进蚁群算法的柔性作业车间调度问题研究[D];昆明理工大学;2015年
2 李平;基于Hadoop的信息爬取与舆情检测算法研究[D];昆明理工大学;2015年
3 赵官宝;基于位表的关联规则挖掘算法研究[D];昆明理工大学;2015年
4 殷文华;移动容迟网络中基于社会感知的多播分发算法研究[D];内蒙古大学;2015年
5 徐翔燕;人工鱼群优化算法及其应用研究[D];西南交通大学;2015年
6 李德福;基于小世界模型的启发式寻路算法研究[D];华中师范大学;2015年
7 郑海彬;一种面向MAPREDUCE的DATASHUFFLE的优化方法[D];苏州大学;2015年
8 赵晓寒;轮换步长PSO算法及SMVSC参数优化[D];沈阳理工大学;2015年
9 安丰洋;基于无线网络的广播算法研究[D];曲阜师范大学;2015年
10 李智明;基于改进FastICA算法的混合语音盲分离[D];上海交通大学;2015年
,本文编号:854811
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/854811.html