基于人工蜂群优化贝叶斯网络的上位性挖掘方法研究
发布时间:2021-04-12 08:53
全基因组关联分析方法作为目前常用的检测影响表型性状的基因位点的方法,可用于分析复杂疾病中的相关遗传机制。但该方法主要侧重于主效基因的检测,忽略了基因与基因之间的相互作用,即上位性。贝叶斯网络在因果关系构建方面具有独特的优势,目前已被广泛地用于上位性挖掘研究。然而贝叶斯网络往往进行局部或者随机搜索,导致容易陷入局部最优,且存在学习效率低、无法处理大规模节点等问题。为了解决上述问题,本文提出了一种基于人工蜂群优化贝叶斯网络的上位性挖掘方法,包括以下3个方面的研究内容:(1)为了提高人工蜂群优化贝叶斯网络上位性挖掘算法中初始网络的质量,在基于约束的贝叶斯网络结构学习方法Fast-IAMB的基础上,设计了omb-Fast算法。在该算法中的马尔科夫毯扩张阶段,重点考虑表型性状对基因位点的影响。根据表型性状与SNP节点之间的条件互信息值判断是否将该SNP节点加入马尔科夫毯中。使得马尔科夫毯能够更加准确地反映出上位性基因位点与表型性状间的关系,从而利用该方法快速准确地生成包括SNP位点和表型性状的初始网络。(2)为了解决贝叶斯网络容易陷入局部最优,进而影响网络构建和上位性挖掘准确性的问题。本文将人工...
【文章来源】:华中农业大学湖北省 211工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
上位性数据格式表示
华中农业大学2020届硕士研究生学位论文362F1-score1/Precision1/Recall=+(34)如Eq.(34)所示,F1-score由精确率和召回率求得,考虑到精确率和召回率两个标准,是评判预测结果好坏的综合指标。F1-score得分越高,说明预测结果的精确率和召回率越好,预测结果中包含的错误关联位点数越少,结果越可靠。4.2.3二节点模拟数据结果与分析通过GAMETES模拟数据软件生成了17组DNME模型二节点强关联数据(见附表1)。本实验比较分析了BEAM,AntEpiSeeker,BOOST,ESMO,omb-Fast以及BnBeeEpi在17组模拟数据集下的效率、准确率、F1-score以及假阳性率。如下图10所示,利用柱形图对以上六种上位性挖掘方法的准确率进行比较。图10上位性2位点模型不同方法的准确率比较Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods
基于人工蜂群优化贝叶斯网络的上位性挖掘方法研究37图10上位性2位点模型不同方法的准确率比较(续图)Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods如图10所示,通过柱形图直观地比较了六种上位性挖掘方法在二节点强关联数据集上的准确率。BEAM算法作为经典的贝叶斯方法,在本次实验中参数均为默认设置,BEAM算法的阈值参数默认设置为0.3。虽然该阈值范围从统计学意义上来说已经很大了,但是从图10可见BEAM算法表现并不好。经过分析发现,该算法具有一定的随机性,导致准确率降低。BnBeeEpi与其他四种上位性挖掘算法在检测准确性上表现优异。其原因是模拟数据的致病模型相比真实数据而言较为简单,并且遗传率的大小控制在[0.05,0.4]区间内,遗传效应显著,因此以上算法容易挖掘出强关联位点。如下图11所示,利用柱形图对六种上位性挖掘方法的F1-score进行比较。
【参考文献】:
期刊论文
[1]遗传风险评分在复杂疾病遗传学研究中的应用[J]. 牛大彦,严卫丽. 遗传. 2015(12)
[2]单核苷酸多态性检测方法研究进展[J]. 常培叶,赵平. 中国老年学杂志. 2015(16)
[3]基于改进粒子群优化算法的贝叶斯网络结构学习[J]. 江浩,江兵. 聊城大学学报(自然科学版). 2015(01)
[4]基于人工蜂群算法的贝叶斯网络结构学习[J]. 张平,刘三阳,朱明敏. 智能系统学报. 2014(03)
[5]全基因组关联研究中的交互作用研究现状[J]. 李放歌,王志鹏,户国,李辉. 遗传. 2011(09)
[6]全基因组关联分析的进展与反思[J]. 凃欣,石立松,汪樊,王擎. 生理科学进展. 2010(02)
[7]混合优化的贝叶斯网络结构学习[J]. 许丽佳,黄建国,王厚军,龙兵. 计算机辅助设计与图形学学报. 2009(05)
博士论文
[1]全基因组单核苷酸多态性交互作用研究[D]. 尚军亮.西安电子科技大学 2013
[2]面向基因表达数据的致病基因挖掘方法研究[D]. 张焕萍.南京航空航天大学 2009
硕士论文
[1]基于多目标蚁群优化算法的全基因组关联分析研究[D]. 景鹏杰.上海交通大学 2015
本文编号:3133018
【文章来源】:华中农业大学湖北省 211工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
上位性数据格式表示
华中农业大学2020届硕士研究生学位论文362F1-score1/Precision1/Recall=+(34)如Eq.(34)所示,F1-score由精确率和召回率求得,考虑到精确率和召回率两个标准,是评判预测结果好坏的综合指标。F1-score得分越高,说明预测结果的精确率和召回率越好,预测结果中包含的错误关联位点数越少,结果越可靠。4.2.3二节点模拟数据结果与分析通过GAMETES模拟数据软件生成了17组DNME模型二节点强关联数据(见附表1)。本实验比较分析了BEAM,AntEpiSeeker,BOOST,ESMO,omb-Fast以及BnBeeEpi在17组模拟数据集下的效率、准确率、F1-score以及假阳性率。如下图10所示,利用柱形图对以上六种上位性挖掘方法的准确率进行比较。图10上位性2位点模型不同方法的准确率比较Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods
基于人工蜂群优化贝叶斯网络的上位性挖掘方法研究37图10上位性2位点模型不同方法的准确率比较(续图)Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods如图10所示,通过柱形图直观地比较了六种上位性挖掘方法在二节点强关联数据集上的准确率。BEAM算法作为经典的贝叶斯方法,在本次实验中参数均为默认设置,BEAM算法的阈值参数默认设置为0.3。虽然该阈值范围从统计学意义上来说已经很大了,但是从图10可见BEAM算法表现并不好。经过分析发现,该算法具有一定的随机性,导致准确率降低。BnBeeEpi与其他四种上位性挖掘算法在检测准确性上表现优异。其原因是模拟数据的致病模型相比真实数据而言较为简单,并且遗传率的大小控制在[0.05,0.4]区间内,遗传效应显著,因此以上算法容易挖掘出强关联位点。如下图11所示,利用柱形图对六种上位性挖掘方法的F1-score进行比较。
【参考文献】:
期刊论文
[1]遗传风险评分在复杂疾病遗传学研究中的应用[J]. 牛大彦,严卫丽. 遗传. 2015(12)
[2]单核苷酸多态性检测方法研究进展[J]. 常培叶,赵平. 中国老年学杂志. 2015(16)
[3]基于改进粒子群优化算法的贝叶斯网络结构学习[J]. 江浩,江兵. 聊城大学学报(自然科学版). 2015(01)
[4]基于人工蜂群算法的贝叶斯网络结构学习[J]. 张平,刘三阳,朱明敏. 智能系统学报. 2014(03)
[5]全基因组关联研究中的交互作用研究现状[J]. 李放歌,王志鹏,户国,李辉. 遗传. 2011(09)
[6]全基因组关联分析的进展与反思[J]. 凃欣,石立松,汪樊,王擎. 生理科学进展. 2010(02)
[7]混合优化的贝叶斯网络结构学习[J]. 许丽佳,黄建国,王厚军,龙兵. 计算机辅助设计与图形学学报. 2009(05)
博士论文
[1]全基因组单核苷酸多态性交互作用研究[D]. 尚军亮.西安电子科技大学 2013
[2]面向基因表达数据的致病基因挖掘方法研究[D]. 张焕萍.南京航空航天大学 2009
硕士论文
[1]基于多目标蚁群优化算法的全基因组关联分析研究[D]. 景鹏杰.上海交通大学 2015
本文编号:3133018
本文链接:https://www.wllwen.com/kejilunwen/yysx/3133018.html