基于多目标蚁群优化算法的全基因组关联分析研究
发布时间:2017-04-20 04:15
本文关键词:基于多目标蚁群优化算法的全基因组关联分析研究,,由笔耕文化传播整理发布。
【摘要】:全基因组关联分析(Genome-Wide Association Studies,GWAS)的目的是在整个基因组范围内寻找与表型相关的易感基因位点变异。近年来,在全基因组关联分析领域涌现了大量的基因及其交互作用检测算法,尽管这些算法在领域内取得了巨大的成功,但当前依然存在着一些难题。一方面,目前在全基因组关联分析领域已经提出的方法在不同的疾病模型上表现差异很大,这可能是因为现有研究方法都是基于单个模型建模而复杂疾病模型各异,所以通常单目标建模方法不能很好的拟合数据,会导致低精度,高假阳性率等各种情况。另一方面,与真实全基因数据的高维特性相比,很多现有方法仅适用于低维度,不能拓展到高维数据上,这也限制了其的使用范围。针对以上问题,本文提出构建一个基于蚁群优化的多目标优化算法。本文的创新性主要体现在以下两方面:在全基因组关联分析领域第一次提出了多目标启发式优化方法,用以解决全基因组关联分析的第一个难题。在算法中,本文结合了来自对立统计学派的逻辑斯蒂回归和贝叶斯网络模型,并分别选用了对应的AIC准则和K2准则评价所建模型。实验中证明,两种评价准则有互补效应,使得算法相比于其他算法能够取得更高的准确率,更低的假阳性率。为了解决全基因组关联数据高维特点带来的空间和时间复杂度问题,本文运用蚁群智能优化算法为基础设计了一个封装式的特征选择算法,可以直接在高维全基因数据上运用,得以解决全基因组关联分析的第二大难题。在实验室中本文运用软件生成了多种疾病模型下的虚拟数据集,并且在一个真实数据集上验证了算法的有效性。
【关键词】:单核苷酸多态性 上位性 全基因组关联分析 多目标优化 蚁群优化
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q811.4;TP18
【目录】:
- 摘要3-5
- ABSTRACT5-9
- 第一章 绪论9-22
- 1.1 研究背景和意义9-14
- 1.2 研究现状及挑战14-19
- 1.2.1 GWAS领域算法概述14-18
- 1.2.2 GWAS领域特征选择方法概述18-19
- 1.3 研究内容和创新19-20
- 1.4 论文组织20-22
- 第二章 GWAS基础概念及实验数据集22-30
- 2.1 GWAS基础概念22-25
- 2.2 实验所用虚拟数据集25-28
- 2.3 真实全基因组关联分析数据集28
- 2.4 本章小结28-30
- 第三章 穷举多目标优化算法及其在GWAS上的应用30-43
- 3.1 逻辑斯蒂回归30-33
- 3.1.1 逻辑斯蒂回归基本原理30-32
- 3.1.2 逻辑斯蒂回归在GWAS上的应用32-33
- 3.2 贝叶斯网络33-36
- 3.2.1 贝叶斯网络基本原理33-34
- 3.2.2 贝叶斯网络在GWAS上的应用34-36
- 3.3 帕累托优化36-39
- 3.3.1 帕累托优化基本原理36-38
- 3.3.2 帕累托优化在GWAS上的应用38-39
- 3.4 基于虚拟数据集的实验评价准则、结果及分析39-42
- 3.4.1 穷尽型多目标法及评价准则39-40
- 3.4.2 实验结果及分析40-42
- 3.5 本章小结42-43
- 第四章 基于蚁群优化的多目标优化算法及其在GWAS上的应用43-61
- 4.1 蚁群优化44-49
- 4.1.1 蚁群优化算法生物学背景44-46
- 4.1.2 蚁群算法及其在GWAS上的应用46-49
- 4.2 皮尔逊卡方检验49-50
- 4.3 基于蚁群优化算法的多目标优化算法50-52
- 4.4 基于虚拟数据集的实验评价准则、结果及分析52-59
- 4.4.1 实验评价准则52-54
- 4.4.2 虚拟数据集上的结果及分析54-59
- 4.5 基于真实数据集的实验结果及分析59-60
- 4.6 本章小结60-61
- 第五章 总结与展望61-63
- 5.1 总结61-62
- 5.2 展望62-63
- 参考文献63-69
- 附录 实验结果数据69-76
- 致谢76-77
- 攻读硕士学位期间已发表或录用的论文77-79
【参考文献】
中国期刊全文数据库 前1条
1 权晟;张学军;;全基因组关联研究的深度分析策略[J];遗传;2011年02期
本文关键词:基于多目标蚁群优化算法的全基因组关联分析研究,由笔耕文化传播整理发布。
本文编号:317888
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/317888.html