基于遗传和粒子群搜索的SNP关联分析算法
本文关键词:基于遗传和粒子群搜索的SNP关联分析算法
【摘要】:全基因组关联分析是研究复杂性状疾病和基因之间强有力的方法,单核苷酸多态性(SNP,Single Nucleotide Polymorphism)正是全基因组关联分析的主要工具,通过对SNP和疾病之间的相关性进行分析,我们可以快速的找出复杂疾病易感位点。但是由于SNP数量巨大且样本容量相对来说比较小,同时由于上位作用的影响,导致搜索空间巨大,使得对于复杂疾病易感位点的检测存在困难。本文致力于复杂疾病和SNP数据之间的关联分析研究,通过分析粒子群算法和遗传算法各自的特点及使用条件,提出了将粒子群算法和遗传算法结合起来进行SNP关联分析的方法和算法。该算法以粒子群算法为框架,通过把遗传算法的交叉变异方式引入粒子群算法的速度变换公式中,对粒子群的搜索位置进行更新,来对粒子群算法的全局搜索能力进行优化。为了在更新粒子位置的过程中针对不同种类的SNP位点,我们采用了三种位置更新的方式:强关联联合、弱关联联合和最优解联合。强关联联合指的是在位置更新的过程中我们更倾向于找寻单个SNP和疾病关联性较强的位点。而弱关联联合指的是在位置更新的过程中我们更倾向于找单个SNP和疾病关联较弱的位点。在最优解关联分析中我们在所有可能的位置穷举找到最优的位置进行更新。采用粒子群和遗传算法结合的方式一方面克服了遗传算法前期收敛慢的缺点,另一方面也将粒子群算法优秀的全局搜索能力引入,极大的增强了算法的时间效率,本文先在仿真数据集上进行试验,验证了算法的可行性及其优越性,紧接着在真实数据AMD数据上进行试验,找出了可能存在的潜在致病位点。通过实验结果之间的比较和分析,可以发现该算法在进行致病位点搜索时有着更好的性能。
【关键词】:SNP关联分析 粒子群算法 遗传算法
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:R394;TP18
【目录】:
- 摘要5-6
- ABSTRACT6-9
- 符号对照表9-10
- 缩略语对照表10-13
- 第一章 绪论13-19
- 1.1 研究背景和意义13-15
- 1.2 国内外的研究现状15-16
- 1.3 本文的主要工作16
- 1.4 本文的结构安排16-19
- 第二章 SNP关联分析19-29
- 2.1 SNP的一些基本概念19-21
- 2.1.1 几种基本概念的介绍19-20
- 2.1.2 SNP关联分析20-21
- 2.1.3 SNP的上位性21
- 2.2 关联分析算法21-28
- 2.2.1 Ant Epi Seeker21-27
- 2.2.2 SNPRuller27-28
- 2.3 本章小结28-29
- 第三章 基于遗传和粒子群搜索的SNP关联分析算法29-43
- 3.1 粒子群算法29-32
- 3.1.1 粒子群算法的基本原理29-31
- 3.1.2 离散粒子群算法31-32
- 3.2 遗传算法32-35
- 3.2.1 遗传算法的原理32-33
- 3.2.2 遗传算法的要素33-35
- 3.2.3 遗传算法的特点35
- 3.3 基于遗传和粒子群搜索的SNP关联分析算法35-39
- 3.3.1 最优解的SNP关联分析算法(GPSO-B)37-38
- 3.3.2 强关联联合的SNP关联分析算法(GPSO-S)38
- 3.3.3 弱关联联合的SNP关联分析算法(GPSO-W)38-39
- 3.4 卡方检验39-41
- 3.5 本章小结41-43
- 第四章 实验研究和结果比较43-55
- 4.1 实验数据介绍43-45
- 4.2 实验在模拟数据上的运行和比较45-51
- 4.3 模拟数据实验结果分析51-52
- 4.4 真实数据上的实验结果与比较52-53
- 4.5 本章小结53-55
- 第五章 总结与展望55-57
- 参考文献57-59
- 致谢59-61
- 作者简介61-62
【相似文献】
中国期刊全文数据库 前10条
1 刘雅琴,迟洪钦;最优合并构成的有序遗传算法[J];上海师范大学学报(自然科学版);2001年04期
2 陈科燕,肖冬荣;基于遗传算法的最优证券投资组合模型[J];南京气象学院学报;2003年05期
3 石先军;一种改进的遗传算法及其应用[J];武汉科技学院学报;2003年06期
4 解滨;应用不定量凸模型的遗传算法解决结构设计的优化问题[J];长春工程学院学报(自然科学版);2003年04期
5 曹晓夏,缪淮扣,高晓雷;一种将遗传算法应用于谓词求精的方法[J];应用科学学报;2003年03期
6 郭宇,韩战钢;周期振荡环境对遗传算法的影响[J];北京师范大学学报(自然科学版);2004年02期
7 李医民,胡寿松;引入生态位技术的遗传算法研究及应用[J];系统工程;2004年05期
8 刘丹杰;遗传算法的编码研究[J];甘肃科技;2004年06期
9 郭文忠,陈国龙;一种新型的遗传算法及其应用[J];福州大学学报(自然科学版);2004年04期
10 张新燕;用遗传算法划分模糊量的语言变量覆盖范围[J];新疆师范大学学报(自然科学版);2004年03期
中国重要会议论文全文数据库 前10条
1 韩娟;;遗传算法概述[A];第三届河南省汽车工程科技学术研讨会论文集[C];2006年
2 庞国仲;王元西;;基于遗传算法控制步长的定性仿真方法[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年
3 林家恒;李国锋;田国会;刘长有;;遗传算法在旋转货架拣选优化中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
4 史骏;裘聿皇;;遗传算法中基因排列方式对运行的影响[A];1996年中国控制会议论文集[C];1996年
5 韩战钢;;遗传算法及在经济中的应用[A];Optimization Method, Econophysics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
6 唐毅;葛运建;王定成;江建举;;遗传算法在运动员技术动作优化中的应用研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 文泾;朱玉文;;用遗传算法进行航线规划[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
8 于春梅;黄玉清;杨胜波;;遗传算法在参数辨识中的应用进展[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
9 王志宏;王斌;;基于遗传算法的非确定性目标优化[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
10 王晓东;刘全利;金吉凌;王伟;;基于序次优化策略的改进遗传算法[A];第二十三届中国控制会议论文集(下册)[C];2004年
中国重要报纸全文数据库 前2条
1 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
2 高雪娟;协同设计的平台策略[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 周辉仁;递阶遗传算法理论及其应用研究[D];天津大学;2008年
2 郝国生;交互式遗传算法中用户的认知规律及其应用[D];中国矿业大学;2009年
3 侯格贤;遗传算法及其在跟踪系统中的应用研究[D];西安电子科技大学;1998年
4 马国田;遗传算法及其在电磁工程中的应用[D];西安电子科技大学;1998年
5 唐文艳;结构优化中的遗传算法研究和应用[D];大连理工大学;2002年
6 周激流;遗传算法理论及其在水问题中应用的研究[D];四川大学;2000年
7 刘冀成;基于改进遗传算法的生物电磁成像与磁场聚焦应用研究[D];四川大学;2005年
8 袁丽华;基于物种进化的遗传算法研究[D];南京航空航天大学;2009年
9 李航;遗传算法求解多模态优化问题的研究[D];天津大学;2007年
10 闫璞;遗传算法在高级计划与排程问题中的若干应用研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 谷克;遗传算法在公路路线智能决策系统中的应用研究[D];长安大学;2008年
2 李艳娇;基于改进遗传算法的刚架结构截面力学特性参数优化的研究[D];吉林大学;2009年
3 任巍;求解极小碰集的遗传算法的研究与改进[D];吉林大学;2009年
4 王赫;混沌遗传算法在模式识别中的应用[D];东北电力大学;2009年
5 于蕾蕾;双种群遗传算法的改进及其应用研究[D];合肥工业大学;2009年
6 王婧;遗传算法及其在聚类分析中的应用[D];华中师范大学;2009年
7 胡文斯;基于遗传算法的车间作业调度问题的研究[D];中国海洋大学;2009年
8 吴明华;基于遗传算法的养护机械生产车间作业调度问题的研究[D];长安大学;2007年
9 尉钰;基于改进遗传算法的桥梁模型动力优化[D];长安大学;2007年
10 王银年;遗传算法的研究与应用[D];江南大学;2009年
,本文编号:1021735
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/1021735.html