当前位置:主页 > 科技论文 > 自动化论文 >

一种分析全基因组上位性的新方法

发布时间:2018-09-18 06:54
【摘要】:传统基于单位点的全基因组关联研究存在重复性低、难以解释性等缺陷,而采用基于机器学习的上位性分析中面临计算复杂度高、预测准确度不足等问题.本文提出一种分析全基因组上位性的新方法,该方法采用二阶段框架的上位性分析方法,它包含特征过滤阶段以及上位性组合优化阶段,在特征过滤阶段提出了多准则融合策略,从多个不同角度评价遗传变异位点,以保证易感的弱效位点能被保留,然后采用多准测排序融合策略剔除与疾病状态关联程度低的遗传变异,进一步在上位性组合优化阶段采用贪婪算法启发式地搜索组合空间,以降低时间复杂度,最后采用支持向量机作为上位性评价模型.实验中采用不同的连锁不平衡参数与经典算法SNPruler与ACO的性能进行对比,实验结果表明:本文方法能有效保留弱效位点,一定程度上提高了疾病预测的正确度.
[Abstract]:The traditional genome association research based on unit points has some shortcomings such as low repeatability and difficult to explain. However, the epistatic analysis based on machine learning is faced with the problems of high computational complexity and low prediction accuracy. In this paper, a new method is proposed to analyze the epistasis of the whole genome. This method uses the two-stage framework of epistasis analysis, which includes the stage of feature filtering and the phase of epistatic combination optimization. In the stage of feature filtering, a multi-criteria fusion strategy is proposed to evaluate the genetic variation sites from different angles to ensure that the susceptible weak sites can be preserved. Then the multi-quasi-test ranking fusion strategy is adopted to eliminate the genetic variation with low correlation with disease state, and then the greedy algorithm is used to heuristically search the combination space in the stage of epistatic combinatorial optimization, so as to reduce the time complexity. Finally, support vector machine is used as the epistatic evaluation model. In the experiment, different linkage disequilibrium parameters are compared with the performance of the classical algorithms SNPruler and ACO. The experimental results show that the proposed method can preserve the weak sites effectively and improve the accuracy of disease prediction to a certain extent.
【作者单位】: 湖南大学信息科学与工程学院;湖南工学院计算机科学与信息学院;
【基金】:国家自然科学基金资助项目(61672223) 湖南省自然科学基金资助项目(2016JJ4029)~~
【分类号】:Q811.4;TP18

【相似文献】

相关期刊论文 前10条

1 余四斌,李建雄,徐才国,谈移芳,高友军,李香花,张启发,M.A.SaghaiMaroof;上位性效应是水稻杂种优势的重要遗传基础[J];中国科学C辑:生命科学;1998年04期

2 廖春燕,吴平,易可可,胡彬,倪俊健;不同遗传背景及环境中水稻(Oryza sativa L.)穗长的QTLs和上位性分析[J];遗传学报;2000年07期

3 郑康乐,庄杰云,樊叶杨,吴建利;杂交水稻产量性状的上位性效应及杂合性与杂种优势的相关性[J];云南大学学报(自然科学版);1999年S3期

4 曹钢强,朱军,何慈信,高用明,吴平;水稻穗长上位性效应和QE互作效应的QTL遗传研究(英文)[J];浙江大学学报(农业与生命科学版);2001年01期

5 曹钢强,朱军,何慈信,高用明,吴平;水稻株高上位性效应和QE互作效应的QTL遗传研究(英文)[J];遗传学报;2001年02期

6 任德勇;何光华;凌英华;桑贤春;杨正林;赵芳明;;基于单片段代换系的水稻穗长QTL加性及其上位性效应[J];植物学报;2010年06期

7 陈剑;郑维敏;王永县;;基因(有效因子)模型及其辨识[J];生物工程学报;1990年04期

8 余四斌,李建雄,徐才国,谈移芳,高友军,李香花,张启发;水稻株高和抽穗期的QTL定位及其上位性效应分析[J];遗传;1998年S1期

9 程君奇;吴建国;石春海;朱军;;三倍体胚乳性状遗传模型的上位性分析(英文)[J];浙江大学学报(农业与生命科学版);2007年01期

10 王伟;叶志云;郑景生;黄育民;黄荣裕;王侯聪;江良荣;;稻米粒形的QTL定位及上位性和QE互作分析(英文)[J];西北植物学报;2010年07期

相关会议论文 前1条

1 江良荣;郑景生;黄育民;王伟;黄建勋;王侯聪;;水稻粒形性状的上位性和QE互作效应分析[A];全国植物分子育种研讨会摘要集[C];2009年

相关博士学位论文 前9条

1 何小红;应用遗传交配设计检测数量性状上位性QTL方法的研究[D];南京农业大学;2010年

2 朱智宏;遗传分析方法和软件开发及其应用[D];浙江大学;2012年

3 高用明;复杂上位性及其与环境互作的QTL定位方法和杂种优势预测研究[D];浙江大学;2002年

4 任光俊;水稻重要性状的遗传基础分析[D];四川农业大学;2001年

5 沈圣泉;水稻(Oryza sativa L.)若干重要性状的QTL主效应、上位性效应及GE互作效应分析[D];浙江大学;2004年

6 杨剑;复杂性状遗传分析方法研究及其软件开发[D];浙江大学;2008年

7 兴旺;干旱胁迫下粳稻产量及相关性状的QTL定位及互作研究[D];东北农业大学;2014年

8 邢永忠;用分子标记剖析水稻重要农艺性状的遗传基础[D];华中农业大学;1999年

9 陈伟;用分子标记剖析油菜重要农艺性状的遗传基础[D];华中农业大学;2008年

相关硕士学位论文 前10条

1 李珊珊;QTL与环境互作的完备区间作图方法研究[D];中国农业科学院;2015年

2 余尘;基于E-bayes的胚乳性状QTL上位性的研究[D];福建农林大学;2015年

3 周智慧;全基因组关联分析中上位性识别算法的研究及其并行化设计[D];吉林大学;2015年

4 程君奇;三倍体胚乳性状遗传模型的上位性分析[D];浙江大学;2006年

5 刘艳兰;全基因组关联研究中的上位性检测算法研究[D];湖南大学;2012年

6 杜月;巢式关联分析新方法及其应用[D];南京农业大学;2012年

7 万素琴;F_(2:3)设计多QTL定位新方法研究[D];南京农业大学;2008年

8 江宝月;水稻抗UV-B的QTLs效应、上位性效应及其与环境互作效应分析[D];福建农林大学;2007年

9 杨盖宇;近等基因系群体的Ghd7和Qph1上位性分析[D];华中农业大学;2010年

10 张秋;普通小麦遗传图谱构建及重要农艺性状的QTL定位[D];山东农业大学;2012年



本文编号:2247126

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2247126.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8f932***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com