面向蛋白质网络功能模块检测的蚁群聚类算法及其并行机制研究
本文关键词:面向蛋白质网络功能模块检测的蚁群聚类算法及其并行机制研究,由笔耕文化传播整理发布。
【摘要】:蛋白质相互作用(Protein-protein interaction,PPI)网络是生命有机体内一种极其重要的生物分子关系网络。从PPI网络中检测功能模块是蛋白质组学的一个重要的研究课题,它能够帮助人们了解细胞的功能和机制,系统地理解各种生物过程。近年来,以机器学习和数据挖掘为基础的计算方法成为了蛋白质功能模块检测的一个有效途径,新的计算方法不断地被提出。然而,随着生物学研究的深入,可获取的PPI网络数据越来越丰富,网络规模越来越大,如何快速准确地从PPI网络中检测功能模块仍然是当今生物信息学面临的一个挑战性的问题。本课题在深入研究基于蚁群聚类的检测算法(ACC-FMD)基础上,开展了如下两个方面的研究工作:(1)ACC-FMD算法在聚类过程中,需要大量的合并过滤和拾起、放下操作,导致时间性能低下。针对该问题,提出了一种快速融合蛋白质基因表达信息的PPI网络蚁群聚类算法(FACC-FMD)。首先,利用基因表达信息计算蛋白质的关键性,并抽取核心组蛋白质;然后,根据蛋白质的关键性对蚁群聚类中的拾起、放下操作做了更严格的约束,以减少拾起、放下的次数从而加速聚类的过程。在三个通用PPI网络数据集上的实验表明,在时间性能方面,FACC-FMD较ACC-FMD有了大幅度地提高;在检测质量方面,FACC-FMD与ACC-FMD以及近年来的一些经典算法相比也具有一定的优势。(2)为了有效地挖掘蚁群聚类算法的并行能力,提出了一种基于Map Reduce并行机制和精英解进化的PPI网络蚁群聚类算法(MRACC-FMD)。首先,MRACC-FMD采用Map Reduce计算模型对蚁群聚类算法中多只蚂蚁求解的部分进行并行化处理以缩短求解时间;然后,利用多个蚁群同时搜索侯选解空间,并将所有种群中的优秀个体放入到精英解进化环境中以实现种群间的信息交互。该算法不仅利用单种群内的解进化,而且借助不同种群间的协同演化,有效地防止算法陷入局部最优,从而提高解的全局收敛性。在虚拟集群环境上的实验表明,新算法在对大规模的PPI网络上具有良好的时间性能。
【关键词】:蛋白质相互作用网络 功能模块检测 蚁群聚类算法 基因表达信息 并行算法
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q51;TP18
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-17
- 1.1 课题研究背景与意义9-10
- 1.2 国内外研究现状10-14
- 1.2.1 PPI网络功能模块检测10-13
- 1.2.2 蚁群聚类算法13-14
- 1.2.3 并行计算技术14
- 1.3 本文的主要研究内容14-15
- 1.4 本文的组织结构15-17
- 第2章 PPI网络功能模块检测及蚁群聚类算法概述17-29
- 2.1 PPI网络及其功能模块检测过程17-22
- 2.1.1 PPI网络概述17
- 2.1.2 PPI网络重要性质17-19
- 2.1.3 PPI网络数据19-20
- 2.1.4 PPI网络功能模块检测过程20-21
- 2.1.5 PPI网络功能模块检测方法评价指标21-22
- 2.2 蚁群聚类算法22-24
- 2.2.1 蚁群聚类算法思想22-23
- 2.2.2 蚁群聚类算法框架23-24
- 2.3 基于蚁群聚类的PPI网络功能模块检测算法ACC-FMD24-26
- 2.4 本章小结26-29
- 第3章 快速融合蛋白质基因表达信息的PPI网络蚁群聚类算法29-45
- 3.1 算法思想29-30
- 3.2 算法描述与分析30-34
- 3.2.1 计算蛋白质的关键性30-31
- 3.2.2 抽取核心组蛋白质31
- 3.2.3 蚁群聚类过程31-32
- 3.2.4 算法描述与分析32-34
- 3.3 实验结果与分析34-43
- 3.3.1 实验数据集34
- 3.3.2 参数对算法的影响34-38
- 3.3.3 与ACC-FMD算法相比38-40
- 3.3.4 与其它经典算法相比40-43
- 3.4 本章小结43-45
- 第4章 基于Map Reduce并行机制和精英解进化的PPI网络蚁群聚类方法45-57
- 4.1 Map Reduce模型45-46
- 4.2 算法思想46-47
- 4.3 算法描述与分析47-51
- 4.3.1 任务划分47-48
- 4.3.2 多种群并行求解48
- 4.3.3 精英解进化48-50
- 4.3.4 算法描述与分析50-51
- 4.4 实验结果与分析51-55
- 4.4.1 参数对算法的影响51-52
- 4.4.2 并行化效果52-54
- 4.4.3 MRACC-FMD与其他算法的比较54-55
- 4.5 本章小结55-57
- 结论57-59
- 参考文献59-63
- 攻读硕士学位期间所发表的学术论文63-65
- 致谢65
【相似文献】
中国期刊全文数据库 前10条
1 俞辉;裴振奎;陈继东;;一种改进的蚁群聚类算法[J];郑州大学学报(理学版);2010年03期
2 徐选华;范永峰;;改进的蚁群聚类算法及在多属性大群体决策中的应用[J];系统工程与电子技术;2011年02期
3 黄旭;马凯;;核空间二次蚁群聚类算法的研究[J];大众科技;2011年02期
4 覃华;徐燕子;张敏;;基于巢模板的核空间蚁群聚类算法[J];广西科学院学报;2010年04期
5 戴建华;;基于模糊集的蚁群聚类算法改进[J];科技信息;2009年25期
6 王智;张自力;;一种新的混合蚁群聚类算法[J];西南师范大学学报(自然科学版);2009年03期
7 宋中山;周腾;周晶平;;一种改进的蚁群聚类算法在客户细分中的应用[J];中南民族大学学报(自然科学版);2013年03期
8 王宗利;刘希玉;;一种基于流形的蚁群聚类算法[J];山东大学学报(理学版);2008年11期
9 孟岩;刘希玉;李镇;;基于蚁群聚类算法的文本模糊聚类方法[J];山东科学;2007年05期
10 莫赞;罗世雄;杨清平;吴静;;基于K-means算法的改进蚁群聚类算法及其应用[J];系统科学学报;2012年03期
中国重要会议论文全文数据库 前5条
1 覃华;徐燕子;张敏;;基于巢模板的核空间蚁群聚类算法的研究[A];广西计算机学会2010年学术年会论文集[C];2010年
2 叶晓曦;;多态蚁群聚类算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 周新华;黄道;;基于改进蚁群聚类算法的最优状态集划分[A];第二十三届中国控制会议论文集(下册)[C];2004年
4 马凯;苏一丹;;一种基于序列相似性的蚁群聚类算法[A];广西计算机学会2009年年会论文集[C];2009年
5 莫锦萍;陈琴;马琳;苏一丹;;使用K-Means优化蚁群聚类模型[A];广西计算机学会2008年年会论文集[C];2008年
中国硕士学位论文全文数据库 前10条
1 林金灼;蚁群聚类算法的若干改进策略的研究[D];福州大学;2014年
2 杨明浩;面向蛋白质网络功能模块检测的蚁群聚类算法及其并行机制研究[D];北京工业大学;2016年
3 王慧;改进的蚁群聚类分析算法的研究[D];河南大学;2009年
4 田园丽;蚁群聚类算法研究与应用[D];辽宁工程技术大学;2011年
5 宋向京;面向复杂网络社团结构发现的蚁群聚类算法研究[D];北京工业大学;2013年
6 曾海群;蚁群聚类算法研究[D];中南大学;2008年
7 刘云;基于蚁群聚类的特征基因选择算法研究[D];湖南大学;2010年
8 罗增琦;一个改进的蚁群聚类优化算法及其仿真实验研究[D];华中科技大学;2006年
9 邹远强;蚁群聚类算法及其在电信客户分群中的应用[D];湖南大学;2007年
10 周腾;基于蚁群聚类算法的客户细分研究与应用[D];中南民族大学;2013年
本文关键词:面向蛋白质网络功能模块检测的蚁群聚类算法及其并行机制研究,由笔耕文化传播整理发布。
,本文编号:294887
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/294887.html